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PCT Patentanmeldung 
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Claus Peter Pietruk 
Heinrich-Lilienfein-Weg 5 
10 D-76229 Karlsruhe 

Vertreter-Nr. 321 605 

Titel: Rekonf igurierbare Elemente 



15 



Def initionen 

20 Rekonf igurierbare Elemente werden abhangig von der auszuf Uhrenden Applikation 
unterschiedlich und applikationsentsprechend ausgestaltet . 

Die Aufgabe der Erfindung besteht darin, Neues fur die gewerbliche Anwendung 
bereitzustellen. 

Die LSsung der Aufgabe wird unabhangig beansprucht. Bevorzugte 
AusfOhrungsformen finden sich in den Unteransprttchen . 



25 



Unter einer rekonf igurierbar en Architektur werden vorliegend Bausteine (VPU) 
30 mit konf igurierbar er Funktion und/oder Verne tzung verstanden, insbesondere 
integrierte Bausteine mit einer Mehrzahl von ein- oder mehrdimensional 
angeordneten arithmetischen und/oder logischen und/oder analogen und/oder 
speichernden und/oder intern/ extern vernetzenden Baugruppen, die direkt oder 
durch ein Bussystem miteinander verbunden sind. 

35 

Zur Gattung dieser Bausteine zahlen insbesondere systolische Arrays, 
neuronale Netze, Mehrprozessor Systeme, Prozessoren mit mehreren Rechenwerken 
und/oder logischen Zellen und/oder kommunikativen/peripheren Zellen (IO), 
Vernetzungs- und Netzwerkbausteine wie z.B. Crossbar-Schalter, ebenso wie 
40 bekannte Bausteine der Gattung FPGA, DPGA, Chameleon, XPUTER, etc.. 

Hingewiesen wird insbesondere in dies em Zusammenhang auf die f olgenden 
Schutzrechte und Anmeldungen desselben Anmelder s : 

P 44 16 881.0-53, DE 197 81 412.3, DE 197 81 483.2, DE 196 54 846.2-53, 
DE 196 54 593.5-53, DE197 04 044.6-53, DE 198 80 129.7, DE 198 61 088.2-53, 
45 DE 199 80 312.9, PCT/DE 00/01869, DE 100 36 627.9-33, DE 100 28 397.7, 

DE 101 10 530.4, DE 101 11 014.6, PCT/EP 00/10516, EP 01 102 674.7, DE 196 51 
075.9-53 , DE 196 54 846.2-53, DE 196 54 593.5-53 , DE 197 04 728.9, DE 198 
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07 872.2 , DE 101 39 170.6 , DE 199 26 538.0 , DE 101 42 904.5 , , DE 102 06 

653.1 , DE 102 06 857.7 , DE 100 28 397.7 , DE 101 10 530.4 , DE 102 02 

044.2 , DE 101 29 237.6-53 , DE 101 42 904.5 , DE 100 50 442.6 , DE 101 35 
210.7-53 , EP 02 001 331.4 , 60/317,876 . Diese sind hiermit zu 

5 Of fenbarungszwecken vollumf anglich eingegliedert . 

Die o.g. Architektur wird beispielhaft zur Verdeutlichung herangezogen und im 
folgenden VPU genannt. Die Architektur besteht aus beliebigen arithmetischen, 
logischen (auch Speicher) und/oder Speicherzellen und/oder Verne tzungsz ell en 

10 und/oder kommunikativen/peripheren (10) Zellen (PAEs) , die zu einer ein- oder 
mehrdimensionalen Matrix (PA) angeordnet sein konnen, wobei die Matrix 
unterschiedliche, beliebig ausgestaltete Zellen aufweisen kann; auch die 
Bus sy st erne werden dabei als Zellen verstanden. Der Matrix als ganzes oder 
Teilen davon zugeordnet ist eine Konf igurationseinheit (CT # Ladelogik) , die 

15 die Vernetzung und Funktion des PA konf iguriert . Die CT kann z. B. als 

dedizierte Einheit gem. PACT05, PACT10, PACT17 , ausgestaltet sein oder als 
Host-Mikroprozessor nach P 44 16 881.0-53 , DE 102 06 856.9 dem PA 
zugeordnet bzw. mit oder durch solche realisiert sein. 

20 

Stand der Technik 

Unterschiedliche PAE-Strukturen sind nach dem Stand der Technik bekannt. Die 
gebrauchlichsten sind durch DE 196 51 075.9-53 , DE 100 50 442.6 , sowie 
25 Chameleon CS2112 definiert. Weiterhin soli auf die bekannten FPGA- Zellen 
verwiesen werden. 

Aus dem universitaren Umfeld sind Zellstrukturen wie die DPGAs, RawMachine 
(DeHuon) , KressArrays (Kress, Uni Kaiser si au tern) , XPUTER (Hartenstein, Uni 
30 Kaiser slant em) , sowie weitere Strukturen bekannt. 

Die nachfolgend beschriebenen Erweiterungen, die fur alle vorgenannten 
Strukturen nutzbar sind, verbessern die Nutzbarkeit der Architekturen und 
PAE-Strukturen in komplexen insbesondere auch stark sequentiellen und/oder 
35 wenig datenf lufiorientierten Anwendungen. Weiterhin wird der AnschluS an 
externe Einheiten (z.B. Speicher und/oder Peripherie) vereinfacht und 
homogenisiert . 



Indirekte Konf igurat ion 

In einer besonderen Ausftihrung einer PAE (IPAE) wird diese oder eine Gruppe 
von PAEs mit einem Speicher (RRAM) , vorzugsweise einer RAM- PAE gekoppelt. Die 
IPAE weist einen eigenen internen Sequenzer auf oder ist mit einem Sequenzer 
45 bzw. Microcontroller mit einem bevorzugt limitierten, d.h. mit einer 

vergleichsweise geringen Anzahl an unterschiedlichen moglichen Befehlen, 
ahnlich wie bei RISC-Prozessozren und/oder bevorzugt vollstandigen 

19. flrpt««b«r 20Q3 _ 
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lllT t ■ 91 " "* Micr °^ oc — ) Sekoppelt. Hit anderen Worten wird 

ZZin ^ RISC PrOZeSS ° r einem magliChSt klei — Befehlssatz der 

3edoch berechnungstheoretisch vollstandig ist, verwendet. In einer 

AusfUhrungsvarxante kann der Seguenzer auch durch eine Konf iguration einer 
5 Oder nearer PAEs g ebilaet werden . Eg ^ der ge J,^^ 

und sexnen, Abl auf verbal ten konf igurierbar ausgestaltet sein (wie 
bexspielsweise nach dem Stand der Technik bekannt, z.B. durch EPS448 von 

zu^deTT Data Book 1993]K Der 

Zustande (z.B. Statussignale, Ereignisse) in der XPAE und/oder auf Zustande 
ein B ^^^^ ~ PAEs, die ait der XPAE verbunden sind (z^^L 

exn BussystenD. reagieren. In eine* Register der XPAE wird ein Pointer auf 

k e ann e ^aZnd% eiC T nhalt -""^ - »• — «~ ~o*J££?£ 
kann wahrend des Reset-Zyklus auf die Startadresse des Codes gesetzt werden 

; ^s^zr**, 1 * seguenzer i±est aen *~* **»«~ 

SwS ^ ""^ ^ SChreibt diesen «*~ Teil dessen) 

entweder xn exn. beispielsweise durcb den Speicberinhalt adressiertes , 

Ts Zl^ToTT^ ^ adreSSie — ™ — -tzt den Speicherxnhalt 
tlLlT ° 61ne nfiChSte Ver **>eitung. ^er Pointer wird durch den 

Adressgenerator entsprechend der ublichen Arbeitsweise von Adresspointern 

T° der ^i Sprungbefehlen ^ ^X, 

in eine T lnS ° Weit Speich ~ ««« Codespeicher und 

xn exner bevorzugten AusfUhrung auch Datenspeicher fur einen SegueLer zur 
Verfugung nnd/oder wird als soXcher genutzt. D er Seguenzer kann^Sx Code aus 
12 ZltT n <RRAM) 168611 ^ ±n Siner AusfOhrung auch Daten \T 

IT , ° dSr ±n SPSiCher Xnsofem steXlt der 

Spexcher auch exnen Datenspeicher fur den Seguenzer dar. 

(CTjTaden 61011 ^ ^ ^ ° b — ^«=en Konf igurationseinheit 

(CT, geladen werden. Xn einer erweiterten AusfOhrung kann der Speicberinhalt 

ZLZ tZlVl IPAE SelbSttodi - — — altemativ L eine, 
werdT f B 6XS ^ elSWeiSe > ^-her geladen oder an diesen geschrieben 

werden, z.B. tiber exnen Anschlufi an ein Frontend. 

in einer AusfOhrungsvariante kann der Speicher und/oder die XPAE einen 

Xn exner dabex besonders bevorzugten Ausgestaltung kann der EXTBUS Ober eine, 

!xLr ^ ' VerbindUng PAE - B -^^ - eine Xnterface-Baugruppe 
CIOAG) wxe bexspielsweise aus PACT03 oder PACT1 5 bekannt realisiert sein Die 

Ansteuerung von Speicher (RAM, und/oder Peripherie (XO, erfolgt dabei 

bevorzugt durch die Interface-Baugruppe. 

in einer besonders bevorzugten Ausgestaltung kann der RRAM selbstandig Code 

Z ltZnT £ Z T seguenzer aber den ™ aus d - -~ ---- 

RAM laden. Dxese Funktxon kann durch eigenstandige, in, rram i.plementxerte 
oder xmplementxerbare Adressgenerator en realisiert warden. Beispielsweise 

D; c rz^s c ch DMA r ntroiier besonders fur diese Auf ^- *** ^z:^ 

° a .^r iSChen den s P-^ern kopieren. Der Adressraum der zu lesenden Daten 

3 
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una der Zieladressraum wird entsprechend gesetzt und der Kopiervorgang wird 
gestartet. Das Setzen kann durch die IPAE erfolgen. 

in einer hardwaremaSig aufwendigeren Losung kann die Punktion durch eine 
xmplementierte MemoryManagemenOhit (MMtJ) realisiert sein, deren allgemeine 
Funktxonswexse durch den Stand der Technik per se definiert und bekannt ist 
Vorlxegend arbeitet die bevorzugte MMu hier wie folgt: 

Der von der MMU verwaltete rram Speicher ist in mehrere Seiten (Pages) 
aufgete.lt. Jede Page en thai t Daten eines virtuellen Speicherraumes innerhalb 
exnes externen Speichers. Beispieisweise konnen die hexadezimalen RRAM- 
Adressen OxOaOO . . OxOaf f Daten des externen Speichers an den Adressen 
0xbdl3200..0xbdl3 2 ff enthalten. Zur Verwaltung der Adressumsetzung wird eine 
Adressubersetzungseinheit verwendet, die vorzugsweise durch in der RRAM-Zelle 
15 vorgesehene Lookup-Tabellen realisiert ist. Die MMU ist nun dazu 

vorgesehen.insbesondere einen groSen Speicherraum auf den sehr viel 
Klexneren des RRAM zu Obersetzen. Dies geschieht vorliegend derart, dass 

lltlZ 'I BSdarf Sr ° 6en ^^rauxn ^ den Kleinen kopiert 

werden. Sobald exne Seite nicht mehr benStigt wird, kann diese geloscht 
una/oder Uberschrieben werden. Wenn die Daten auf der Seite verandert wurden, 
wxrd dxe Sexte bevorzugt vor dem Baschen/Oberschreiben in den groSen 
Spexcherrraum zurtickgeschrieben . 

Die Adressumsetzungseinheit arbeitet dann derart, dass ein hoherwertiger Teil 
der physxkalxschen Adresse (also die Adresse der Seite) in dem Lookup- 
Spexcher abgelegt wird und auf die entsprechenden Daten der Seite im RRAM 
zexgt sobald die Seite innerhalb des kleinen Speichers (RRAM) verfugbar ist. 
Dadurch kann ein Zugriff auf die Seite erfolgen. Fehlt die Seite im RRAM, ist 
auch kexne Referenz eingetragen. in diesem Fall muss die Seite erst von 
exnem groSen (externen) Speicherraum in den RRAM kopiert werden. Hierzu kann 

Si! T«r e ' ^ V ° rZUgt aktUel1 nicht verwendete Seite gemafi dem vorstehenden 
Ablauf tiberschrieben werden. 

Das Kopieren kann dabei automatisiert. also ohne wesentliche Beteiligung 
durch den Seguenzer erfolgen, indem von der MMD" ein DMA-Kontroller 
angesteuert wird. Die erf indungsgemafie MMCJ des hier offenbarten RRAM ist 
daher mxt einer Ansteuerung fur einen DMA-Kontroller versehen und/oder 
verbxndbar. Diesem werden die entsprechenden Seitenadressen im RRAM und 
externen RAM, sowie die SeitengroSe durch die MMU zur VerfQgung gestellt, z. 
W B. xndem sie in Register eingetragen werden. 



25 
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in einer moglichen und applikationsabhangig ggf . bevorzugten Ausfuhrung 
kennen mehrere EXTBUS-Interface implementiert sein. 

in einer moglichen AusfUhrung ist der RRAM in mehrere Segmente unterteilf, 
^ t ^ n a .r terSChieaiichen Adressbereichen liegen. Die Segmente kttnnen 
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5 aber fest implementiert sind, besitzen: ° n «srur*erbar sind, bevorzugt 

Sequenzer-/Code-Speicher Sta<-v D " „ . 

0 tonfis«ri«t .old- «°l 3 «de taSMdWo. vor 3es «l,„ 

sedu^.rs. S^Lt -tor R „i. tra « TO M te „,„ 

r Re 9 ls tersatz optional im rram liegen. 

und/oder Lese-ZuorHf T * rlauben den B»f . auch gleichzeitigen Schreib- 
SpaL" t " h mehrere ^-herzugriffseinheiten auf den 

S2^^t^STf Ml-lMlt - k ° nnen bei - iel — -erne 

Multi-Port SpeLherist nr^T 26880 " 11 ' ° ie Pu » kti - ™ 

spexchern ist nach dem stand der Technik ebenfalls bekannt. 
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die PAE nach dem aus DE 196 54 846.2-53 bekannten Verfahren bei der 
Verwendung als lokal Konf igurationseinheit . Wird die PAE als globale 
Konf igurationseinheit verwendet, oder sind sehr viele lokale PAEs zu 
konfigurieren, wird bevorzugt das Verfahren nach DE 196 54 593.5-53 
5 verwendet, das eine FILMO-Funktionalitat aufweist und daher sehr viele und 
auch voneinander unabhangige Konf igurationen verwalten kann. 
Die IPAE adressiert, z. B. gesteuert durch den Sequenzer/ Microcontroller, 
Konf igurationen im RRAM und konfiguriert diese an PAEs und/oder sich selbst 
und/oder bestimmt den Ablauf des Sequenzers /Microcontrollers . Bevorzugt 

10 f indet hierbei eine Synchronisation mit einer tibergeordneten CT ahnlich der 
bekannte Inter -CT-Protokolle (DE 198 07 872.2, DE 100 28 397.7 , DE 199 26 
538.0 ) statt. Die IPAE RRAM Schaltung kann Konf iguration ttber eines der 
EXTRAM- Interface selbst laden und/oder Konf igurationen von einer 
tibergeordneten CT tiber das CT Interface anfordern. Die Funktionsweise kann 

15 ahnlich der Rekonf igurationseinheit in DE 196 54 846.2-53 sein. Die 
Konf igurationsdaten fur die PAEs werden durch die IRAM an die PAEs 
weitergeleitet oder in einer bevorzugten Ausgestaltung direkt von RRAM. Zur 
Auf teilung der Daten im RRAM an mehrere PAEs kann dabei ein 
Busverteilverfahren ahnlich des in DE 101 10 530.4 beschriebenen SIMD- 

20 Bussys terns verwendet werden. 

Mit anderen Worten ist die prinzipielle Arbeitsweise einer IPAE RRAM 
Verschaltung ahnlich einem Microcontrollersy-stem, dessen Busanbindung 
und/oder dessen Da ten transfer und/oder dessen Programmablauf einem VPU- System 
25 entspricht . 



Es wird insbesondere Schutz fur IPAE-RRAM-Verschaltungen beansprucht, bei 
denen die IPAE und das RRAM jeweils als separate Funktionselemente (PAEs) 
eines rekonf igurierbar en Bausteins ausgestaltet sind und typischerweise 
30 beliebige Verschaltungen und Funktionen ausfuhren kCnnen, aber jedoch 

speziell zum Einsatz der erf indungsgemafi beschriebenen Sequenzerstruktur aus 
IPAE und RRAM entsprechend konfiguriert und verwendet werden k6nnen. Die 
Konf iguration erfolgt dabei bevorzugt durch die ubergeordnete 
Konfigurationseinheit CT. 

35 

Ebenfalls wird Schutz beansprucht fur PAEs, die zusatzlich zu ihrem Anschluss 
an die intemen Bussys teme des Arrays aus PAEs einen dedizierten Anschluss 
(IO-Channel) an ein ttberregionales Bussystem aufweisen, das insbesondere 
Daten aber lange Strecken innerhalb des Arrays ttbertragt und/oder 

40 insbesondere direkten Anschlufi an die Peripherie aufweist. Der AnschluS an 

die Peripherie kann dabei direkt erfolgen, indem z. B. das Bussystem bereits 
dem peripheren Protokoll entspricht oder uber entsprechende Protokollwandler 
zur Umsetzung des Protokolls erfolgen. Das dedizierte Bussystem kann dabei 
bereits einem Industriestandard entsprechen, z. B. PCI , RapidIO, Firewire, 

45 USB, Ethernet, RAMBUS , DDR- RAM etc. urn somit einen einfachen und 

unaufwendigen Anschluss der peripheren Gerate zu ermdglichen. Gegebenenf alls 
kdnnen auch in zwischengeschalteten IOAGs (vgl. DE 196 54 595.1-53 ) 

It. ftscuUr 3003 - 
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Protokollkonvertierungen derart durchgeftthrt werden, so dass ein internes 
vereinfachtes und ggf . proprietares Busprotokoll auf ein oder mehrere 
komplexere externe Standardprotokolle ubersetzt werden. 

Es soil besonders darauf hingewiesen werden, dass unter Peripherie auch 
5 Speicher verstanden werden, wie bei den bereits aufgezahlten Busprotokoll en 
verdeutlicht wird. 

Ebenfalls ist erf indungsgemafi besonders relevant, dass PAEs auch mehrere 
Anschltzsse an dedizierte Bussysteme aufweisen kSnnen. 
10 *" 7 

Desweiteren sind anwendungsabhangig auch Architekturen sinnvoll, bei denen 
nur eine Teilmenge der PAEs Anschlusse an ein dediziertes Bus system aufweist, 
Oder unterschiedliche PAEs mit einer unterschiedlichen Anzahl von Anschlttssen 
an ggf . auch unterschiedliche dedizierte Bussysteme aufweisen. 

15 

Im folgenden wird eine detaillierte Beschreibung einer Ausfahrungsvariante 
der erfindungsgemafien Kopplung von IPAE und RRAM ausgeftihrt: 

Es wird erfindungsgemafi bei einem in Funktion und/oder Vernetzung 

20 insbesondere zur Lauf zeit ohne St8rung nicht zu rekonf igurierender Elemente 

rekonf igurierbaren Zellelementef eld zur Datenverarbeitung mit Funktionszellen 
zur AusfOhrung algebraischer und/oder logischer, konf igurierbarer Funktionen 
und Speicherzellen, um Inf ormationen zu empfangen, abzuspeichern und/oder 
auszugeben vorgeschlagen, daS eine Steuerverbindung (CMD) von den 

25 Funktionszellen zu den Speicherzellen gefuhrt ist. Diese Steuerverbindung 

dient dazu, die Adress- und/oder Datenein/ausgabe aus dem Speicher durch die 
zugeordnete Funk t i onsz ell e, • typisch einer ALU-PAE, steuerbar zu machen. So 
kann etwa angegeben werden, ob die nachste tibertragene Information als 
Adress e oder als Da ten behandelt werden soli und ob ein Lese- und/oder 

30 Schreibzugrif f erforderlich ist. Diese Datenubertragung aus der 

Speicherzelle, bei der es sich etwa um eine RAM-PAE handeln kann, auf die 
ALU-PAE erlauben dann, daS neue, von der ALU abzuarbei tende Befehle in diese 
geladen werden konnen. Es ist auf diese Weise mdglich, lediglich durch 
Vorsehen einer dedizierten und dediziert funkt ions zellenkontrollier ten 

35 Steuerverbindung zwischen Funk t i onsz el le und Speicherzelle bereits mit nur 
zwei Elementen, die liber geeignete Busse verbunden sind, eine 
Sequenzerstruktur in einem Zellelementef eld aufzubauen, ohne dafi ansonsten 
weitere Mafinahmen und/oder bauliche Veranderungen erforderlich sind. In der . 
Speicherzelle kennen Da ten, Adress en, Programmschritte usw. in per se aus 

40 herkQmmlichen Prozessoren bekannter Weise abgelegt werden. Weil beide 

Elemente auch in anderer Weise bei entsprechender Konf igurat ion einsetzbar 
sind, ergibt sich eine besonders effiziente Bauweise, die sowohl 
Sequenzerstrukturen als auch vektoriellen und/oder pa- rallelisierbaren 
Strukturen besonders gut anpafibar ist. 

45 

Es ist einsichtig, dafi durch die Verwendung von lediglich zwei Zellen in 
einem Zellelementef eld, namlich der Funktionszelle und der 

If. S«peanb«r I0OI _ 
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Informationsbereitstellungszelle eine Vielzahl von sequenzerartigen 
Strukturen in dem rekonf igurierbaren Zeilelementef eld aufgebaut werden kann. 
Dies ist insofem vorteilhaft, als oftmals bei der Datenverarbeitung, etwa in 
eina " ""Ititaskingfahigen Betriebssystem, eine Reihe unterscbiedlicher und 
voneinander per se verschiedener Aufgaben abgearbeitet werden mufi. Es kennen 
dann eine Vielzahl derartiger Aufgaben in einem einzigen Zeilelementef eld 
effektiv gleichzeitig abgearbeitet werden. Die Vorteile far 
Eohtzeitanwendungen sind of f ensichtlich. Weiter ist es auch moglich, die ' 
emzelnen Seguenzerstrukturen, die in einem Zell- elementefeld unter 
Vorsehung der erf indungsgemaiSen Steuerverbindung aufgebaut werden, mit 
unterschiedlichen Taktraten zu betreiben, etwa urn den Stromverbrauch dadurch 
zu senken,' daS Aufgaben mit geringerer Priori tat langsamer abgearbeitet 
werden. Es ist uberdies mSglich, bei der AusfUhrung per se weitgehend 
paralleler Algorithmen seguenzerartige Programmteile in dem Feld parallel 
Oder vektoriell abzuarbeiten und umgekehrt. 

Das Zellelementefeld mit den in Funktion und/oder Vemetzung konf igurierbaren 
Zellen kann einsichtigerweise einen Prozessor, einen Coprozessor und/oder 
einen microcontroller bilden, bzw. eine parallele Vielzahl Oder Kombinationen 
20 derselben. 

Die Funktionszellen sind typisch als arithmetische Logikeinheiten gebildet, 
wobei sxe insbesondere grobgranulare Elemente darstellen, die aber mit einer 
femgranularen Statemachine versehen sein konnen. In einem besonders 
bevorzugten AusfOhrungsbeispiel handelt es sich bei den ALUs urn sogenannte 
erweiterte ALUs (EALU) . wie diese in den f rtiheren Anmeldungen des 
vorliegenden Anmelders beschrieben wurden. Eine Erweiterung kann insbesondere 
die Steuerleitungskontrolle, Befehlsdekodiereinheit etc. umfassen, soweit 
erforderlich. Es soli darauf hingewiesen werden, dass grundsatzlich zumindest 
exne Teilmenge der Funktionszellen auch aus f eingranularen FPGA-Elementen 
aufgebaut sein kann. 
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Die Speicherzellen k6nnen Daten und/oder Informationen flUchtig und/oder 
nichtflachtig speichern. Wenn in den Speicherzellen abgelegte Informationen, 
seien es Programmschritte, Adressen fiir einen Zugriff auf Daten oder 
registerartig bzw. heap-artig abgelegte Daten als flUchtige Daten abgelegt 
sind, so kann eine vollstandige Rekonf iguration wahrend des Betriebes 
erfolgen. Alternativ ist es moglich, nichtf ltichtige Speicherzellen 
vorzusehen. Die nichtf lQchtigen Speicherzellen konnen etwa als EE-Prom- 
Bereich und dergleichen vorgesehen werden, in die ein rudimentares Bios- 
Programm abgelegt wird, das bei Inbetriebnahme der Anordnung auszufahren ist. 
Auf diese Weise kann ohne weitere Bauteile eine Inbetriebnahme einer 
Datenverarbeitungseinrichtung erfolgen. Ein nichtf ltlchtiger Datenspeicher 
kann auch dann vorgesehen werden, wenn aus Kosten- und/der RaumgrUnden 
beschlossen wird, daS immer wieder dieselben Programmteile auszufahren sind, 
wobei dann auch unter solchen festen Programmteilen, etwa nach Art der WAVE- 
» a «^f,tf Urati ° n ' im Betrieb gewechselt werden kann. Die MOglichkeiten, 

8 



Akte: PACT31PCToe „. 



10 



15 



20 



derartige nichtf luchtige Speicher vorzusehen und zu verwenden, sind 
Gegenstand anderer Schutzrechte des Anmelders. Es 1st moglich, sowohl 
fiachtige als auch nichtf luchtige Daten in den Speicherzellen abzuspeichem, 
etwa um ein Bios-Programm fest abzulegen und die Speicherzelle dennoch fur 
andere Zwecke nutzen zu konnen. 

Die Speicherzelle ist bevorzugt so ausgebildet, dafi sie eine hinreichende 
• Vielzahl von zu verarbeitenden Daten und/oder abzuarbeitenden Programmteilen 
spexchern kann. Es sei dabei darauf hingewiesen, dafi diese Programmteile 
sowohl als Progranonschritte ausgebildet sein konnen, die jeweils vorgeben, 
was eine einzelne, insbesondere die zugeordnete pae, also insbesondere die 
die Spexcherzelle steuemde Funktionszelle, im nachsten Schritt zu tun hat, 
als auch ganze Konfigurationen fur Feldbereiche oder andere Felder beinhalten 
kann. In einem solchen Fall ist es ohne weiteres meglich, dafi die aufgebaute 
Sequenzerstruktur einen Befehl ausgibt, auf Grund dessen eine Rekonf iguration 
von Zellelementefeldbereichen erfolgt. Damit arbeitet die diese Konf iguration 
auslosende Funktionszelle dann zugleich als Ladelogik (CT) . Es sei darauf 
hxngewxesen, dafi die Konf iguration von anderen Zellen wiederum dergestalt 
erfolgen kann, dafi dort eine sequenzerartige Datenverarbeitung erfolgt und es 
xst xn diesen Feldern wiederum mflglich, andere Zellen im Verlauf der 
Programmarbeitung zu konf igurieren bzw. rekonf igurieren . Damit ergibt sich 
exn xteratxves Konfigurieren von Zellelementebereichen und ein Einschachteln 
von Programmen mit Seguenzer- und Parallel-Strukturen, die ahnlich ineinander 
geschachtelt sind wie eine Babuschka. Es sei darauf hingewiesen, dafi hier 
xnsbesondere durch Ein-Ausgabezellen ein Zugriff auf weitere 

Zellelementefelder aufierhalb eines einzelnen integrierten Bausteines erfolgen 
kann, was die Gesamtrechenleistung massiv erhOhen kann. Es ist insbesondere 
mbglxch, bei Auftreten von Konfigurationen in einem Codeteil einer in ein 
Zellelementefeld hineinkonf igurierten Sequenzerstruktur gegebenenfalls 
entweder die Konfigurationsanforderungen auf einem zugewiesenen 
Zellelementefeld, das von der jeweiligen Sequenzerstruktur allein verwaltet 
wxrd, durchzufOhren und/oder es kflnnen derartige Anf orderungen an eine 
Konfigurations-Mastereinheit abgegeben werden, urn sicherzustellen, dafi eine 
glexchmafiige Belegung aller Zellelementefelder erfolgt. Es ergibt sich somit 
J3 quasx exn Unterprogranunaufruf durch Obergabe von erf orderlichen 

Konfigurationen an Zellen oder Ladelogiken. Dies wird fur sich als 
schutzwardig angesehen. Es sei auch darauf hingewiesen, dafi die Zellen, 
sofern sie selbst fur die Konf iguration anderer Zellelementf eldbereiche 
Zustandxgkeit besitzen, mit hard- oder sof twareartig implementierten FILMO- 
Strukturen und dergleichen zur Sicherstellung einer ordnungsgemafien 
Rekonfiguration versehen sein konnen. Auf die M6glichkeit, die Speicherzellen 
wahrend der Abarbeitung von Befehlen derart zu beschreiben, dafi sich der 
abzuarbeitende Code bzw. das abzuarbeitende Programm andert, sei hingewiesen. 
in einer besonders bevorzugten Variante ist diese Art der Selbstmodif ikation 
45 (SM) aber durch eine entsprechende Steuerung tlber die Funktionszelle 
unterdrUckt . 

i 
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ZstlL^Z' ^ SP6iCherZelle ^-peicherte Information bier auf die 

eintref fen mu S , das nicht unmittelbar mit dem Ausgang der Speicherzllle 
verbunden warden kann. Xn einem solchen Pali kann die Speicherzelle Daten auf 
dxeses Bussystem insbesondere uber Ruckwartsregister (Bac^"^^^ 
ausgeben. Es ist daher bevorzugt, wenn zumindest eine von Speicherze^le 

So^- punktions r eiie ein soiches b — d- R eg ister aufwei; : h L im 

= - LforSLg von 

f B einen Bef ^ J" Hlneinladen in die PAE ohne weiteres denkbar ist. 1 
einen Befehl LOAD++ zu realisieren 

^LchenT 9 " ^ Bedarf dUrCh ±n ^ »*-*echnologie des Anmelders 
dxl MalL^eirn < r G, '. Und ^^<BHEC)-Heg ist er gefuhrt. niese besitzen 
toLS™ « \T Z Chen h0riz0ntalen Bussystemen vertical zu 

Vollstandigkeit halber sein darauf hingewiesen, dass FREG und BREG (entgegen 
SSl^TT V niCht 2WangSl ^ fi - K^terstufen darstellen, sonaerT 
Itt llT K° n f k ° nfi ^^- agister aufweisen. 

des aktuell ausgefahrten JELrr^Lr BUSdatSnt — entsprechend 

sxe ^? iChe " elle W±rd ^vorzugt dazu angeordnet sein, Inf ormationen von der 
sie steuernden Funktionszelle zu empfangen, wobei auch weiter ein 
Informatxonsexnspexchern uber eine Ein-Ausgabezelle und/oder eine die 
ZZ v e o" elle n±Cht StSUernde 26116 mSgliCh iBt - -sbesondere Zn L 
^ s ;r; ia "T Z6lle ^ die S * ei <*—^ gescbrieben werden 
sollen, ist es bevorzugt, wenn auch diese Ein-Ausgabezelle (I/O-PAE, von der 

nrr n e ge n s r uert wird - Dabei w — die Ad — ^ weiLreL 

FlttxonLelT^^r " SChrSibende ° d - ^gebenenfalls auch direkt an die 
Funktxonszelle (PAE) zu ubertragende Information zu lesen ist, an die I/O-PAE 

hL!: r * W "™ t , ffl -» ittalt sei in diese, Zusammenhang darauf 

hxngewxesen dafi diese Adresse uber eine AdreSubersetzungstabelle 
(Adresstranslatxontable), einen Adresstranslationbuf f er oder eine MMu-artige 
Struktur xn der l/o-PAE festgelegt werden kann. Es ergeben sich inZs'dere 
xn exn em solchen Pall die vollen Functionality typischer Mikroprozessoren. 

Die Funktionszellen-Speicherzellenkombination ist demnach in einer 

danTan Va 1 ante 2UmindeSt Ei - A -^e-Mittel zugeordnet, mit welchem 

XLE. - "" eXterne Einhei ^ eine andere Funkticnszelle, Functions zellen- 
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Speicherzellen-Kom-bination und/oder Speicherzellen Information gesandt 
und/oder von dieser empfangen werden kann. 

Die Ein-Ausgabe-Einheit wird dabei bevorzugt gleichfalls zum Empfang von 
5 Steuerbefehlen aus der Funktionszelle ausgebildet. 

Die Funktionszellen-Speicherzellenkombination weist bevorzugt 
Datentransfermoglichkeiten an die tibrigen Funktionszellen und/oder 
Speicherzellen eines VPU-Bausteines auf , insbesondere solchen, die sich ira 
10 Array aus PAEs (PA) befinden. Hierzu werden Zugrif f smSglichkeiten ttber die 
Bussysteme auf die entsprechenden Zellen zur Verfagung gestellt. Der Zugrif f 
erfolgt bevorzugt Uber die Forward- und/oder Backward-Register der PAEs der 
Funktionszellen-Speicherzellenkombination, durch die ttbertragung der "Port"- 
Steuerkommandos . 



In einer bevorzugten Variante ist die Steuerverbindung (CMD) dazu 
ausgebildet, zumindest einige und bevorzugt alle der nachf olgenden 
Steuerkommandos zu Ubertragen: 

20 

OPCODE FETCH, 

INTERNE /EXTERNE DATENZUGRIFFE, 

POSITIONIERUNG VON INTERNEN/ EXTERNEN ADRESSPO INTERN, 
POSITIONIERUNG VON INTERNEN/ EXTERNEN PROGRAMMPO INTERN, 
25 PROGRAMMPOINTER INCREMENT , 

POSITIONIERUNG VON INTERNEN/ EXTERNEN STACKPOINTERN, 
STACKZUGRI FFE ( PUSH , POP ) 

Beispielsweise kann diese Funktionalitat durch folgende CMD Steuerkommandos 
30 implementiert werden: 

load__const: Lade eine Konstante in ein Register 

write_Rap: Setze Adress Pointer fur Speicherzugrif f e 



15 



45 



40 wr i t e &decr_Rsp : 



35 



set_Rpp: 
set&push_Rpp: 



read&incr_Rsp : 



write_Reg: 



r ead_Reg : 



read_Rap : 



(z. B. Heap) 

Lese Adress Pointer fttr Speicherzugrif fe 
(z. B. Heap) 

Lese ein Register aus dem Speicher (wenn Register in der 
RAM-PAE implementiert sind) 

Schreibe Daten in ein Register im Speicher (wenn Register 
in der RAM-PAE implementiert sind) 

Schreibe ein Datenwort auf den Stack und dekrementiert 
den Stackpointer 

Lese ein Datenwort vom Stack und inkrementeiere den 

Stackpointer 

Setze Programmpointer 

Schreibe Programmpointer auf Stack und setze 
Programmpointer neu 
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Dxe Steuerkommandos dienen der Steuerung der angeschlossenen Speicherzellen 
und Funktionszellen (PAEs) . Weiterhin steuem die Steuerkommandos den 
Datentransfer auf den Bussystemen, beispielsweise durch Ansteuerung von 
Multiplexer^ Switches. Transmission Gates, o. a. in den Forward- und 
Backward-Regis tern ( FREG/ BREG ) . Weitere Befehle sind z. B.x 

read_Port: Lese Daten von einem Port (beispielsweise implementiert 

durch ein FREG) zum Array 
write_Port : Schreibe Daten auf einen Port (beispielsweise 

implementiert durch ein BREG) zum Array 

Dies kann durch eine entsprechende Bitbreite der Steuerleitung und eine 
zugeordnete Decodierung bei den EmpfSngern erfolgen. Die jeweils 
erforderlichen Steuer- und Dekodiermittel kannen problemfrei und 
kostengtinstig vorgesehen werden. Wie ersichtlich, ergibt sich mit den 
Sxgnalen eine praktisch vollstandige Sequenzerfahigkeit der Anordnung. DaS 
auf dxese Weise eine Allgemeinzweckprozessordatenverarbeitungseinheit 
erhalten wird, sei erwahnt. 

Die Anordnung wird typisch so gewShlt sein, dafi die Funktionszelle als 
allexniger Master auf die Steuerverbindung und/oder ein als Steuerverbindung 
dxenendes Bussegment bzw. Bussystem zugreifen kann. Es ergibt. sich somit eine 
Anordnung, bei der die Steuerleitung als Command-Lei tung wirkt/ wie sie in 
herkammlxchen Prozessoren vorgesehen ist. 

Die Funktionszelle und die Speicherzelle bzw. I/O-Zelle sind bevorzugt 
benachbart angeordnet. Unter benachbart kann dabei wie bevorzugt verstanden 
werden, dafi die Zellen unmittelbar nebeneinander angeordnet sind. Altemativ 
befxnden sie sich zumindest dicht beieinander. Die Anordnung der Funktions- 
und Speicherzellen in Nachbarschaf t zueinander sorgt dafur, dafi keine, 
jedenfalls keine signif ikanten Latenzzeiten zwischen Ansteuerung und 
Dateneingang der angeforderten Information in der Funktionszelle auftreten, 
nur weil die Verbindungen zwischen den Zellen zu lang sind. Dies sei als 
„dxrekt» verstanden. Mttssen Latenzzeiten berticksichtigt werden, so kann auch 
exn Pipelining in den Seguenzerstrukturen vorgesehen werden. Dies wird 
besonders wichtig bei sehr hoch getakteten Anordnungen. Es sei darauf 
hingewiesen, dafi es ohne weiteres moglich ist, entsprechend hochfrequent 
getaktete Zelleinheiten vorzusehen, die wie xm Stand der Technik per se 
bekannt. auch entsprechend schnell auf geeignete Speicherzellen zugreifen 
konnen. Auch in einem solchen Fall, etwa wenn per se bekannte 
Architekturelemente fOr die Funktionszellen verwendet werden, wird 
gleichzeitig eine Rekonf igurierbarkeit des Funktionszellenelementes und der 
zugeharigen Vemetzungen vorzusehen sein. In einer besonders bevorzugten 
Variante sind die Funktionszellen, die Inf ormationsbereitstellungszellen wie 
Speicherzellen, I/O-Zellen und dergleichen multidimensional angeordnet, 
insbesondere nach Art einer Matrix bzw. auf Gitterpunkten eines 
eindimensionalen Gitters usw. Wenn eine regelmafiige Struktur vorliegt, wie 

f i ™,°f t der Fal1 ±St ' wird einer Zelle tyPisch aus einer ersten Reihe 
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zuoe^ T ^ eXm den ' *»«*«»»tla 0 « f Triggersignale usw. 

zugefOhrt wahrend xn einer darunterliegende Reihe Daten, Triggers ignale una 
andere Informatxonen abgegeben werden. In einem solchen Fall wird ef 

dZT gt T S f n ' Werm ZSllen in Sin UDd derse lben Reihe und es kann 

erford er i h rmatl ° nSfcranSfer ^ "onsbereitstellungszelle in den 

erforderlxchen Exngang der Funktionszelle Ober ein Backward-Register 

erw^T M8gliChkeit ' diS Re5ist - ™* Pipelining zu benutzen, sei 

Es wird welter Schutz beansprucht far ein Verfahren zum Betrieb eines 
Zellelementefeldes, insbesondere multidimensional Zellelementef eldes mit 
FunJctxonszellen zur Ausfuhrung algebraischer und/oder logischer Funktionen 
Ein IT ° r ™ atl ^ Sbereitstellu ^-"-. insbesondere Speicherzellen und/oder 
Exn-Ausgabezellen zum Empfangen und/oder Ausgeben von Informationen und/oder 

« z^Se d ! rSelben ' W ° bei 2UlnindeSt — *r Funktionszellen Steuerbefehle 
an zumxndest exne Inf ormationsbereitstellungszelle ausgibt, dort im 
Ansprechen auf die Steuerbef ehle Information fur die Funktionszelle 
berextgestellt wird und die Funktionszelle dazu ausgebildet ist, die weitere 

durcT^ 9 * BWh " 1 b -^^stellte Infection 

durchzufuhren, urn so sequenzerartig Daten zu verarbeiten. 

Es wird also in einem rekonf igurierbaren Feld durch die Ausgabe der 
Steuerbefehle an die Speicherzelle einer Sequenzerstruktur eine 
seguenzerartige Datenverarbeitung ermeglicht. Die Befehle, die als 
Steuerbefehle von der Funktionszelle ausgegeben werden kannen, ermoglichen 
dabex exnen sequenzerartigen Betrieb, wie er aus herkommlichen Prozessoren 
bekannt xst. Es sei darauf hingewiesen. da* es ohne weiteres moglich ist, nur 
Texle der genannten Befehle zu implement! eren und dennoch eine vollstandig 
seguenzerartige Datenverarbeitung zu gewahrleisten. 

Die vorstehende Ausfuhrungsvariante wird im folgenden noch einmal und 
dur!h" elSWeiSe anhand ZeiChnUn5en beschrieben. In dieser ist gezeigt 



Fig. 


1 


ein erfindungsgemaSes Zellelementef eld, 


Fig. 


2a 


ein Detail hiervon, 


Fig. 


2b, c 


das Detail von Fig. 2a wahrend verschiedener 


Fig. 




Da t enverarbe i tungs zei ten , 


3a 


eine alternative Aus ftthrungs form des Details 






von Fig. 2, 


Fig. 


3b 


eine besonders bevorzugte Variante des 






Details. 


Fig. 


4 


Grundaufbau einer Funktions-/Speicherzelle 






(PAE) 


Fig. 


5 


eine Aus gestal tungs variante von Fig. 3b 
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S~r Un9 0104 ^ kti — OXM zu den SpLcherzelxt ™ 

Zunachst wird die Arbeitsweise von Fig. la beschrieben. Fig lb stellt eine 
iQ bevor ZU gte Ausgestaltung und Anordung der Funktionszellen L JpeicberzellL 

frei^^T^ 0101 ^ ^ Ve - et2 ^ a« Elemente 0102, 0103 0104 

ZnfiT fi9Ur r rbar ' ^ ^ 0hne « en » Betrieb nicht neu 11 

till T Zellelem -^-le - staren. Dabei kannen die Verbindungen 

konfxguriert werden, indem Bussysteme 0105 wie erforderlich gesc^lt^ 
15 warden. Waiter sind die Funktionszellen 0102 in ihrer jeweixlgen F^ktion 

e^e^ siS' 1 ™ f^^' ^figuration em.agXichende SchaXtkreise 
KoZ^r, • Statemachines, Schnittstellenbeschaltung zur 

hingewSLn * entSpreCh - d - Voran.neXdungen des Welders wird 

l^lnl^TT, 0102 ' 0103 Zellel — ^Ides 1 sind zweidiznensionaX in 

25 ^ i anffe0rdnet ' wobei J—il. eine Speicherzelle 0103 

S^cne^lV T : inSr ^egt und bier je Keibe drei 

SeiSerzel ~-^"-"«-*"«. vorliegen, in denen die Funktions- und 
Tnl nT i l' Ste — ^dungen 0104 nlteinander verbunden 
St de^ 1 FUnktl ° nS - ^^"ellen 0102, 0103 weisen Eingange auf, die 

30 Z JZTrZT 0b :T b RSine ' 111 ^ SlCh -weiligen^elle^^te 

^ A^rj ^ ZU empfan ^' *it* -isen die Zellen 0102, 

ausae^n T I daS BUSSyStem 0105 unterhalb der Reibe Daten 

ausgeben. W.e noch erlautert werden wird, ist uberdies jede Speicberzelle 

Bus unterhalb" 1 ™ -rsehen, durcb welches Oaten von L 

35 durcZesSl ^ * ^ f Bus *~ jeweiligen Reibe 

aurchgeschleust werden kdnnen. 

T^TTT SteUerVer bi ^«ngen 0104 und der zugeordneten Schaltungen 
tZ zT^ZlT^r 11 * 11 (AL ° in Fi9 - 2) ^eicherzellen (RAM in 

40 Si' ? - . ^ S1 ^ Zellelemen tefeld — Datenverarbeitung von 
DaLv herk6mmliCheS ^ellelementefeld, wie es bei rekonf igurierbaren 

Datenverarbextunsanordnungen, beispielsweise einer VPO entsprechend der XPP- 
lltZTl Tl*™* 1 **** ^brauchlioh und bekannt ist. Xnsbesondere Zl L 
!n t ^ f Fl9 ' 1 b6kannt betr - b - werden, weist also 

45 ^ tS ! reChSnde BeschaXtungen zur Wave-Rekonf iguration, zum Debugging, 

45 Obertragen von Triggers ignai en etc. auf. 
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Dx e Besonderhexten des Zellelementefeldes der vorliegenden Erfindung ergeben 
sxch aus der Steuerverbindung 0X04 und der zugehSrigen Beschaltung, die 
nachfolgend naher beschrieben werden wird mit Bezug auf die Fig. 2a-c. Es sei 
dabex erwahnt, daS, wahrend in Fig. 1 eine Steuerverbindung 0104 stets von 
exnem weiter links liegende Funktionszellenelement zu einer weiter rechts 
ixegenden Speicherzelle gefuhrt i st , und zwar nur und genau zu einer solchen 
Spexcherzelle, es einleuchtenderweise moglich ist, auch far die 
Steuerleitungen eine konfigurierbare Vemetzung vorzusehen, urn entweder an 
anderer Stelle liegende Speicherzellen anzusprechen und/oder urn ggf . me hr als 
erne Spexcherzelle ansprechen zu konnen, wenn etwa in grofiem Umfange 
Spexcherbedarf fur Informationen besteht, die von den Speicherzellen zu 
empfangen, abzuspeichem und/oder auszugeben ist. Aus Grunden der 
Obersichtlichkeit wird aber in Fig. 1 und 2 lediglioh auf fest vorgesehene 
exnzelne Steuerverbindungen Bezug genommen, was das Verstandnis der Erfindung 
wesentlxch erleichtert. Die Steuerverbindung ist im Ubrigen 
erforderliohenfalls durch herkommliche Leitungen, entsprechende Protokolle 
vorausgesetzt, substituierbar. 

in Fig. 2 ist die Funktionszelle 0102 als ALU und die Funktionszelle 0103 als 
RAM be-xchnet. Oberhalb der Reihe, in der die Zellen liegen, verlauft der 

Tal l * ! M bSreitS Srwahnte Backward-Register 0103a mit den Eingangen 
0103b der Spexcherzelle und 0102b der ALU verbindet. Das unterhalb der Reihe 

uTo^ ^nl BUSSyStem ±St ° 105b bezei ^t und es sind von dem Bussystem 

0105a, 0105b nur die relevanten Segmente gezeichnet. Es ist erkennbar, dafi 
das Bussystem 0105b altemativ Daten erhalt aus einem Ausgang 0102c der ALU 
0102, exnem Ausgang 0103c des RAM 0103 und dafi es Daten in den Eingang 0103al 
des Backward-Registers fuhrt. ~ 

Die ALU 0102 weist zugleich weitere Bin- und Ausgange 0102al, 0102a2 auf. die 
auf andere Bussegmente geschaltet sein konnen und Ober welche die ALU Daten 
wxe Operanden empfSngt bzw. Ergebnisse ausgibt. 

Die Steuerverbindung 0104 befindet sich dauerhaft unter der Kontrolle der 
erweiterten Schaltkreise der ALU und stellt hier eine Verbindung dar, tlber 
welche eine Vielzahl von Bits ttbertragen werden kann. Die Breite der 
Steuerverbindung 0104 ist dabei so gewahlt, daS zumindest die zuvor 
beschreibenen Steuerbef ehle an die Speicherzelle und die Forward/Backward- 
Register (FREG/BREG) ubertragen werden k6nnen. Die Speicherzelle 0103 weist 
zugleich bevorzugt drei Speicherbereiche auf, namlich einen sog. Stack- 
Berexch, einen Heap-Bereich und einen Programm-Bereich . Jedem Bereich ist 
dabex ein eigener Zeiger zugeordnet, Uber den bestimmt ist, auf welchen 
Berexch des Stacks, des Heaps und des Programmbereiches jeweils lesend oder 
schrexbend zugegriffen wird. 

Der Bus 0105a wird im Zeitmultiplex gemeinsam von den Einheiten 0102 und 0103 
verwendet. Dies ist in den Fig. 2b, 2c angedeutet. So ist in Fig. 2b eine 
f .™.t? n sezeigt ' in richer aus dem Ausgang 0102a2 der ALU-PAE Daten Ober 
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das Backward-Register auf den Eingang der RAM-Zelle gesandt werden fcennen 

speist wShr«nrt * Register an den Eingang 2b der ALU-PAE 0102 

speisc, wanrend der Ausgano der Ai,n-pat? nmo,, • , ... 

0103b der RAM-PAE kein lil.Tl T 1V 1St ^ " l Eingang 

™ keiD Slgnal ^Pfangen wird. Aus diesem Grund sind die 

TXllt^ Verbin<3Un9en ^P^ert und so.it als inaktiv 

innerhalb der RAM-Zelle 0103 1st eine Schaltung 0103d vorgesehen, in der die 
ZZ^TZll^Zl 4 ^ S ~— glent Oio/L^ 

Die AusfOhrungsvariante der Erfindung wird verwendet wie folgt: 

ZunSchst empfangt die ALU 0102 Konf igurationsinf ormation von einer zentralen 
Ladelogik. wie in stand der Technik bereits ^ 

^ZT-^ZltlZ^: 9 ^ ^ ^ bSkannter W6iSe Verwendung des 

^leloir ^rgleichen geschehen. Auf die Mdglichkeit, bei der 

KonfiZ t ein ^ FILM °- SE>eicher — vorzusehen, u* eine ordnungsgemaGe 
Konfiguration der Anordnung zu ermaglichen, wird hingewiesen. 

^ITJT, T ™ 0102 wird — h — — ~ 

Praoraimn - • ba ° el °9 lk ubertragen. die ein seguenzerartig abzuarbeitendes 

rZfl " Pr ° granTO kann 6ntWeder bereits *» «« Berechnung 

bzw^ AusfOhrung der Applikation auszufahrende Program sein, Oder einen . 

von e'er ~t darStellSn ' te — fahrende Applikationsprogra™ 

PrL~T ernSn J fc (SpeiChSr ' ^P^erie, ladt. D as Laden des 

Sch^L ? -"alien, wenn ein Teil des der ALU zugeordneten Speichers 

TV" B * ROM ' EPR0M ' EEPR0M ' Flash " R OM) ausgestaltet ist und ein 
insbe^ T T APPlikatlons ^— *>rt fest gespeichert ist. Dies kann 

ZT T7 dalm V ° rteil Sein ' ^ die ^li^tion vorab bekannt ™ 
und unabanderlich gestaltet werden v flT1 n t . 1SC 

zueiner erbeblicben Kostenrld^n^ W . ^ 

"r'dlV 0 "^"" 011 ^ ^ Lei — — -nen -Ce— Befebl 
Wrhllb 2 P ^ ranTO2eig - ZUm Sch «iben auf einen vorgegebenen Wert 
innerhalb des RAM setzt. Danach werden von der Ladelogik bei der ALU 

ZgL"eTo e i03a en ^ ^ ^ ^ ta °™ ° 105bl ™* *» ^ackward- 

RaTo103 r d T, gSlangen d ° rt ^ ElnganS ° 103b *~ RAM- 

sClerleitu^ ° 103d ents » r ~ h -« — Steuerbefehls auf 

Steuerleitung 0104 dann Daten auf den angewiesenen Programmspeicherplatz 
geschrieben. Dies wiederholt sich bi« i • , anunspeicnerpiatz 

». noic sxcn, bis samtliche, von der Ladelogik bei der 
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Konf iguration empfangenen Programmteile in der Speicherzelle 0103 abgelegt 
sind. Wenn dann die Konf iguration der ALU beendet ist, wird diese durch 
Ausgabe der entsprechenden Befehle auf der Steuerleitung 0104 die nachsten, 
von ihr seguenzerartig abzuarbeitenden Programmschritte anfordern und tiber 
den Ausgang 0103c, den Bus 0105b, das Backward-Register der RAM-PAE 0103 und 
den Bus 0105a an ihrem Eingang empfangen. WShrend der Programmabarbeitung 
kSnnen dabei Situationen auftreten, bei denen Spriinge innerhalb des 
Programmspeicherbereiches erforderlich sind, Daten in die ALU-PAE aus der 
RAM-PAE geladen werden, Daten im Stack abgelegt werden mussen usw. Die 
diesbezttgliche Kommunikation zwischen ALU-PAE und RAM-PAE erfolgt ttber die 
Steuerleitung 0104, so dafc die ALU-PAE zu jedem Zeitpunkt die Dekodierung 
durchftihren kann. ttberdies kdnnen auch, wie bei einem herkommlichen 
Mikroprozessor, Daten aus einem Stack oder einem anderen RAM-Speicherbereich 
empfangen werden und es konnen uberdies Daten von aufierhalb als Operanden in 
der ALU-PAE empfangen werden. 

Es findet dabei die Abarbeitung der Programmsequenz statt, die in den RAM-PAE 
durch die Ladelogik vorkonf iguriert wurde. In der ALU-PAE wird dabei 
zugleich, wie per se erforderlich, eine Bef ehlsdekodierung vorgenommen. Dies 
geschieht mit den per se gleichen Schaltkreisen, die schon fur die 
Dekodierung der von der Ladelogik erhaltenen Befehle verwendet werden. 

Es wird Ober die ALU zu jedem Zeitpunkt die Steuerleitung 0104 kontrolliert, 
so daS die RAM-Zelle stets genau die Art des Speicherzugrif f es befolgt, die 
von der ALU vorgegeben ist. Auf diese Weise ist sichergestellt , dafi 
ungeachtet der Zeitmultiplex-Benutzung der Buselemente 0105a, b jederzeit den 
in der Sequenzerstruktur vorhandenen Elementen vorgegeben ist, ob auf den 
Bussen Adressen ftir zu holende und/oder zu schreibende Daten oder Codes 
liegen oder ob und gegebenenf alls wohin Daten zu schreiben sind etc. 

Die in Bezug auf Fig. 2 gezeigte Anordnung kann auf unterschiedliche Arten 
erweitert oder verandert werden. Besonders relevant sind die in Fig. 3a und 
3b dargestellten Varianten. 

Nach Fig. 3a ist zur Verbindung von oberen und unteren Bussen nicht nur ein 
Backward-Register an der RAM-PAE vorgesehen, sondern es sind auch ein 
Vorwarts -Register an der RAM-PAE und Vorwarts- und RUckwarts -Register an der 
ALU-PAE vorhanden. Diese kSnnen, wie durch die Mehrf ach-Pf eile angedeutet, 
dazu dienen, von anderen Einheiten, wie extemen Hosts, externen Peripherie-* 
Geraten wie Festplatten, Hauptspeicher und dergleichen und/oder von anderen 
Sequenzerstrukturen, PAEs, RAM-PAEs etc. Daten zu empfangen und an diese zu 
senden. Wenn ein entsprechender Anf orderungsbef ehl far neue Programmteile aus 
der Sequenzerstruktur, die durch die ALU-PAE und die RAM-PAE gebildet ist, 
abgesandt wird, ist es mdglich, ProgrammblGcke in der Sequenzerstruktur 
abzuarbeiten, die weit grower sind als jene, die in der RAM-PAE speicherbar 
sind. Dies ist insbesondere bei komplexen Datenverarbeitungsauf gaben. 
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Sprtingen tiber weite Bereiche, insbesondere in Unterprogramme usw. von 
massxvem Vorteil. 

Eine noch weiter bevorzugte Variante ist in Fig. 3b gezeigt Hier 
kommuniziert die ALU- PAE nicht nur mit einer RAM-PAE, sender* zugleich nit 
exner Input/Output-PAE, die dazu ausgebildet ist, eine 

Schnittstellenbeschaltung far die Kommunikation mit extemen Bauelementen 
vorzusehen, wie Festplatten, anderen XPP-VPUs, fremden Prozessoren und 
Coprozessoren usw. Wiederum ist die ALU-PAE die Einheit, die als Master fur 
die als „CMD» bezeichnete Steuerverbindung arbeitet und wiederum werden die 
Busse in Multiplex-Weise verwendet. Auch hier kann eine Ubertragung von Daten 
von dem Bus unterhalb der Reihe in den Bus oberhalb der Reihe durch das 
Backward -Register erfolgen. 

Die in Fig. 3b gezeigte Anordnung ermBglicht es, externe Zugriffe auf nicht 
1,1 S P elc ^rzelle RAM-PAE abspeicherbare Inf ormationen besonders leicht zu 

gestalten und ermSglicht damit eine Anpassung der Sequenzerstruktur an 
bestehende, herkommliche CPO-Technologien und deren Betriebsverfahren in noch 
starkerem Mafie insoweit, als nun in der Eingabe-Ausgabezelle 
AdressObersetzungsmittel, Speicherverwaltungseinheiten (MMU-Funktionen) und 
derglexchen implementiert sein konnen. Die RAM-PAE kann hier etwa als Cache, 
insbesondere aber als vorgeladener Cache dienen. 

Es sei darauf hingewiesen, daS mehrere Sequenzerstrukturen gleichzeitig in 
exn und dasselbe Feld hineinkonf iguriert werden kannen, daE Funktionszellen, 
Spexcherzellen und ggf . Ein-Ausgabezellen wahlweise fUr Sequenzerstrukturen 
und/oder eine fur die XPP-Technologie herkommliche Weise konfiguriert werden 
konnen und daS es ohne weiteres moglich ist, daS. eine ALU an eine andere ALU 
Daten ausgxbt, die diese in einer Sequenzer-Weise konf igurieren und/oder zum 
Texl exnes Zellelmentef eldes machen, mit dem eine bestimmte Konf iguration 
abgearbeitet wird. Auf diese Weise wird dann gegebenenfalls auch die 
Ladelogik entbehrlich. 

Figur 4 zeigt nun noch einmal detailliert den Grundaufbau einer PAE. Der Kern 
exner PAE. typischerweise bestehend aus einer oder mehreren ALUs und/oder 
exnem Speicher und/oder FPGA-Elementen erhalt Daten von dem Bussystem 0105a 
und Ubertragt die Ergebnisse der Datenverarbeitung an das Bussystem 0105b 
Neben dem Kern sind die Forward-Register (FREG, 0402) und Backward-Register 
(BREG, 0403) angeordnet und tlbertragen Daten von 0105a nach 0105b (FREG) bzw 
von 0105b nach 0105a (BREG) .BREG und FREG k6nnen ebenfalls eine Oder mehrere 
ALUs und/oder einem Speicher und/oder FPGA-Elementen enthalten. Bevorzugt 
sxnd dxese jedoch in ihrem Funktionsumf ang gegentlber dem Kern (0401) 
eingeschr&nkt. 

Die Bussysteme 0105a und 0105b sind bevorzugt jeweils in ein Bussystem zur 
Obertragung von Daten (DATA) und ein Bussystem zur Ubertragung von Trigger, 
also Statussignalen (TRIGGER) unterteilt. 
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Die Konfiguration der PAE erfolgt durch eine ubergeordnete 
Konfigurationseinheit (z. B. eine CT), die ttber einen Konf igurationsbus 
(0404) Konfigurationsworte an die PAE ttbertragt. Diese werden in 
Konfigurationsregistern gespeichert (0405). Optional kann ein 
Konfigurationsstack. (0406) nach PACT17 und wie nachfolgend beschrieben 
zwischen den Konf igurationsbus (0404) und die Konf igurationsregister (0405) 
zwischengeschaltet sein. 

Der Konfigurationsstack kann Daten und/oder bevorzugt Trigger von den 
Bussystemen 0105 (a/b) empfangen und an diese senden. 

Die PAE kann optional einen AnschluS an ein dediziertes Bussystem (10- 
Channel, 0407) aufweisen. Zur Steuerung des Bussystems ist dem Kern (0401) 
eine zusatzliche Bussteuereinheit (0408) zugeschaltet . ttber den IO-Channel 
kan die PAE direkt mit einem globalen, ggf . auch externen Speicher und/oder 
Peripherie und/oder anderen PAEs Daten ubertragen. 

In einer bevorzugten Ausgestaltung besteht die Moglichkeit Konstanten fur die 
Datenverarbeitung Uber 0404 zu setzen. In einer weiteren Ausgestaltung kann 
eine Konfigurationseinheit (z. B. CT) Daten aus den Arbeitsregistem 
auslesen. 

Figur 4 kann auch eine entsprechende RAM- PAE darstellen. ttber 0404 kann dann 
von einer CT die Vernetzung und Funktion des RAMs eingestellt werden. 
Die Funktion umfaSt beispielswiese folgende Funktionen Oder Kombinationen 
daraus : 

1 . Random Access 

2 . FIFO 

3 . Stack 

4 . Cache 

5. Page Memory fur MMUs 

Desweiteren kann in einer bevorzugten Ausfuhrung der Speicher mit Daten von 
der CT vorgeladen werden (z. B. Konstanten, 

Lookup-Tabellen, etc.), Ebenfalls kann die CT in einer erweiterten Ausfuhrung 
Daten (z. B. zum Debuggen Oder fur Taskwechsel) aus dem Speicher Uber 0404 
zurucklesen. 

In einer bevorzugten Ausfuhrung kann eine RAM- PAE mehrere Anschlttsse an das 
Bussystem 0105 aufweisen (dual-port oder multi-port) , wodurch mehrere 
Da ten transfers gleichzeitig durchgeftthrt werden kdnnen. 

In einer weiteren Ausfuhrung kann die RAM- PAE einen dedizierten Anschlufi an 
einen externen Bus aufweisen. 

RAM- PAEs kGnnen derart zusammengeschaltet werden, dass aus mehreren (n) RAM- 
PAEs ein n-fach grGSerer Speicher entsteht. 
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Fxgur 5 zeigt eine Ausgestaltungsvariante des Sequenzers nach Figur 3b. Die 
Till ^ minimalen ^"'ersatz Ra, Rb, r* auf . der in diesem 

Bexspxel ledxglxch zur Pufferung der Operanden und Ergebnisse dient. Der 

IT^llt ^ 9iSte ! SatZ - «~ RAM-PAE <R0..Rn>. Ebenfalls innerhalb 

der RAM-PAE lxegen die Register 

Rpp: Programm Pointer 

Adress Pointer fur Datenzugrif f e (z.B. Heap) 
Stack Pointer fur Stackzugrif f e 
Frame Pointer zur Sicherung des Stack Pointers 
bei Unterprogrammaufrufen 



Rap 
Rsp 
Rfp 



Der CMD-Bus wird von der ALTJ-PAE gesteuert und iibertrSgt die 
Ablaufxnformation des Seguenzers an samtliche beteiligten PAEs, sowie FREG 
15 u^OSb^ SteUerUng ^ Daten ^ertragung auf den Bussystemen (0105a, 

Die RAM-PAE weist in diesem Ausgestaltungsbeispiel einen dedizierten IO- 
Cannel (0501) auf, tiber welchen sie ggf. auc h selbststandig (z. B. uber DMA- 
Kontroller) Daten von Oder zu peripheren Einheiten (z.B. IO, Speicher) 

2f> ^r'r 9en . kann - ES 8011 nochmals dar *^ hingewiesen werden, dass auch die 
20 ALU-PAEs einen solchen dedizierten AnschluS aufweisen konnen Oder in einer 

wexteren Ausgestaltungsvariante die ALU-PAE anstatt der RAM-PAE einen 

derartigen AnschluS besitzen kennte. 

Optional sind eine oder mehrere Datenaustauschvorrichtungen mit den 
restlichen Zellen des PAs (z. B. Funktions- und/oder Speicherzellen) 
25 implementiert. Uber Eingabe-Ports (0502) k6nnen Daten von dem PA gelesen 
werden und tlber Ausgabe-Ports (0503) konnen die Daten ausgetauscht werden. 
Dxe Port werden beispielsweise Uber die CMD-steuerkommandos read_port und 
wrxte_port angesteuert und schalten die Bussysteme entsprechend. Mit den 
Steuerkommandos wird ein Selektor ubertragen, der anzeigt welcher Port durch 
das Steuerkommando angesprochen ist. 
Die vorliegend offenbarte Lage der Register innerhalb der RAM-PAE ist 
ungewohnlich, bietet aber zwei erhebliche Vorteile- 

a) Speicherzellen kannen fur die Register verwendet werden. 

b) Die Pointer liegen direkt in der RAM-PAE, wodurch Datenzugrif f e auf den 
35 Spexcher besonders schnell werden. Desweiteren ist fur samtliche Speicher- 

Zugrxffe nur ein Bus auf dem Bussystem 0105 notwendig, wobei der 
normalerweise zusatzlich erf orderliche Adressbus entfallt, da die Adressen 
lokal in der RAM-PAE durch die Pointer gegeben sind 

Diese Anordnung wird daher als vom Anmelder bevorzugt typisch implementiert: 



40 



FUr samtliche Datentransf ers ist die Lage der Register zu beachten. Urn 
ledxglxch mbglichst einfache Befehle im Sequenzer zu implementieren, sind 
daher besondere Befehle zur Registermanipulation vorgesehen: 
moveta Rrr: Ladt das Register Rrr (rr e {l.. n , sp ( pp, 

fp» ap}) nach Ra 
movetb Rrr: Ladt das Register Rrr nach Rb 

20 
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movefx Rrr: Schreibt das Register Rx nach Rrr 

Um den Datenf luScharacter der ALU zu wahren, ist bevorzugt ein weiterer 
besonderer Opcode implementiert : 
5 feed: tibertragt Daten von Ra/Rb nach Rx, ohne diese 

zu manipulieren. 

Nachfolgende Beispiele verdeutlichen die Arbeitsweise des Sequenzers: 
Addiere Register Rl zu Register R2 und schreibe Ergebnis nach Register R2 : 
10 move t a Rl; movetb R2; add; movefx R2; 

Schiebe Register R4 nach Register R7 : 
moveta R4; feed; movefx R7; 

15 Obertrage R5 auf Stack: 

moveta R5; feed; push; 
Anmerkung: push tibertragt Daten des Registers Rx an die Speichers telle auf 
die Rsp zeigt und dekrementiert (bzw. inkermentiert). Rsp. 

20 Setze Adresspointer Rap mit der indirekten Adresse R4 addiert zu R7 : 
moveta R4; movetb R7; add; movefx Ra; 

Lade Daten aus Speichers telle Rap nach Rl : 
load; feed; movefx Rl; 
25 Anmerkung: load tibertragt Daten von der Speichers telle auf die Rap zeigt nach 
Ra. 

Die Datenregister werden bevorzugt innerhalb des Speichers der RAM-PAE 
angeordnet, z. B. von Adresse 0x0 bis 0x7 (fur n = 7) , Register werden 
30 beispielsweise angesprochen, indem beim Auftreten des entsprechenden CMD 

Steuerkommandos (z. B. read_reg, write_reg) die Registernummer mitubertragen 
wird, diese als Adresse an den Speicher (ibertragen wird und die haherwertigen 
Adressbits mit 0 gefullt werden. 

Die Startadresse fur den Code ware dann beispielsweise 0x8 (also Qx(n+1)), 
35 worauf dann der Programmpointer Rpp nach einem Reset zeigen wtirde. 

Die Adresszeiger werden bevorzugt nicht im Speicher abgelegt, sondern in 
gesondert implement ierten Regis tern untergebracht, um eine schnelle und 
einfache Aufschaltung auf die Adressleitungen des Speichers zu ermaglichen. 

40 In Figur 5b ist eine Architekturvariante mit Regis tersatz innerhalb der ALU- 
PAE dargestellt. Die umstandlichen Regis t er trans feroperationen ent fallen 
damit, wodurch diese Variante auch erheblich schneller in der 
Datenverarbeitung ist. Allerdings ist sind die Hardwarekosten haher, da der 
Regis tersatz zusatzlich implementiert werden muss und ftir samtliche 

45 Speicherzugrif fe die Adressen von der ALU-PAE an die RAM-PAE tlbertragen 
werden mtissen. 
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RAMoverPAE 

Die nachfolgend beschriebene besondere Ausgestaltung einer ALU-PAE (la 
Folgenden nut ROP-PAE bezeichnet) eignet sich besonders far VPUs, deren 
Applxkatxon irregulare sequentielle Codes aufweisen, die auf kleine 
Datenaengen in einer weitgehend ungeordneten Reihenfolge zugreifen. 

Zur Realisierung dieser Aufgabe wird in eine ALU-PAE Speicher integriert 
(integrated RAM = IRAM) , auf den die ALU direkten Schreib/Lese-Zugrif f 
besitzt. Die ALU ist entsprechend um eine Adressverwaltungsschaltung 

ZtTT^ eS ° ndere k0nnen daher PAES MCh ^ -rstehend beschriebenen 
Aufbau (iPAEs) verwendet warden, wobei der separate RRAM ggf. entfallt und 

^ ouasiTT'T IRAM SrSetZt ±St ° der ^ ^^zlich zum intemen 

IRAM quasi als Speichererweiterung vorgesehen ist. 

In einer besonders bevorzugten Ausfuhrung ist ein Seguenzer bzw 
Microcontroller ait einem bevorzugt limitierten aber bevorzugt vollstandigen 
Befehlssatz (vgl . ARC Microprocessor) in der ROP-PAE integriert, der die 
Verarbeitung sequentieller Codes eraoglicht. In einer weiteren 
Ausftihrungsvariante kann der Seguenzer in seiner Funktion und seinem 
Ablaufverhalten auch konf igurierbar ausgestaltet sein (wie beispielsweise 

Boot l^^n T6Chnik bSkannt ' Z - B ' dUrCh EPS44S V ° n [ALTERA Data 

Book 1993]). Der Sequenzer/Microcontroller kann auf Zustande {z B 

Statussxgnale, Ereignisse, in der ROP-PAE und/oder auf Zustande (z. B. auch 
Trxgger) anderer PAEs die ait der ROP-PAE verbunden sind (z.B. uber ein 
25 Bussystem) reagieren. 

Der Sequenzer/Microcontroller liest seine Programmbefehle aus dea IRAM 
Die Zugriffe auf das Bussystea des Arrays (pa) entsprechen den Ublichen PAEs, 
ebenso die Generierung, der Eapfang und die Weiterleitung von Statussignalen 
(Trigger nach PACT08) . Mehrere Busanbindungen fur Daten- und Triggereingange 
und fur Daten- und Triggerausgange kSnnen vorgesehen sein 

Die ROP-PAE kann Operanden vom Bus lesen ggf. aehrzyklisch Verarbeiten und 
das Ergebnis wieder auf den Bus schreiben. 

in die ROP-PAE ist in einer bevorzugten Ausgestaltung ein Registersatz 
integriert. Der Registersatz kann in einer besonderen Ausgestaltung ahnlich 
des Registersatzes von Transputern als stack organisiert. Dadurch kann der 
Registersatz besonders klein und hardwaretechnisch effizient realisiert 
werden (typischerweise reichen 3 Register A, B und C aus) . Weiterhin ist aus 
der Transputertechnologie bekannt, dass Compiler effizient ait einea 
derartigen hardwaretechnisch kostengunstigen Registersatz arbeiten konnen. 
Ebenfalls kann der Registersatz optional im RRAM liegen. 

in einer bevorzugten Ausfuhrung besitzt die ROP-PAE direkten Anschlufi 
(EXTBUS) an ein externes RAM und/oder externe 10. Es kdnnen 

applikationsabhangig mehrere EXTBUS vorgesehen sein. In einer dabei besonders 
bevorzugten Ausgestaltung kann der EXTBUS tlber eine, ggf. dedizierte, 
Verbindung des PAE-Bussys terns an eine Interface-Baugruppe (IOAG) wie 
^ S ^ SWeiSe aUS DE 196 54 595.1-53 Oder DE 102 06 653.1 bekannt 
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realisiert sein. Die Ansteuerung von Speicher (ram, und/oder Peripherie (XO, 
erfolgt dabex durch die Interf ace-Baugruppe . 

In einer bevorzugten Ausfuhrung kann die ROP-PAE und dabei bevorzugt das I RAM 

7, 1 SelbSt * ndig A <^** das exteme RAM und/oder die externe IO 

und/oder andere interne Speicher (RRAM/IRAM, generieren und externe Oder 
xnteme Datentransfers selbstandig steuern. Diese Funktion kann durch 
exgenstandige im rram implementierte Adressgeneratoren realisiert werden. 
Bexspxelswexse eignen sich DMA-Kontroller besonders fur diese Aufgabe, indezn 

16 hloc *»^ s * D ^ zwischen den Speichern kopieren. Der Adressraum der zu 
lesenden Daten und der Zieladressraum wird entsprechend gesetzt und der 
Kopxervorgang wird gestartet. Das Setzen kann durch die IPAE erfolgen 
in exner hardwaremaSig aufwendigeren LSsung kann die Funktion durch eine 
xm P lementierte MemoryManagementUnit (MMU) realisiert sein. Die Funktionsweise 
xst durch den Stand der Technik definiert und bekannt. ZusammengefaSt 
arbeitet eine MMU wie folgt: 

Der von der MMU verwaltete RRAM Speicher ist in mehrere Seiten (Pages) ■ 
aufgeteilt. Jede Page enthalt Daten eines virtuellen Speicherraumes innerhalb 
exnes externen Speichers. Beispielsweise konnen die hexadezimalen RRAM- 
Adressen OxOaOO. . OxOaff Daten des externen Speichers an den Adressen 
0xbdl3200..0xbdl32ff enthalten. Zur Verwaltung der Adressurasetzung wird eine 
Adresstlbersetzungseinheit verwendet, die gewohnlicherweise durch Lookup- 
Tabellen realisiert ist. Aufgabe einer MMU ist es insbesondere einen groSen 
Speicherraum auf einen sehr viel Kleineren (in diesem Fall der RRAM) zu 
25 Ubersetzen. Dies geschieht derart, dass Seiten je nach Bedarf von dem groSen 
Spexcherraum in den Kleinen kopiert werden. Sobald eine Seite nicht mehr 
benotxgt wird kann diese geloscht und/oder tlberschrieben werden. Wenn die 
Daten auf der Seite verSndert wurden, wird die Seite bevorzugt vor dem 
Loschen/Uberschreiben in den groSen Speicherraum zuruckgeschrieben 
Dxe Adressumsetzungseinheit arbeitet derart, dass ein hoherwertiger Teil der 
physxkalischen Adresse (also die Adresse der Seite) in dem Lookup -Speicher 
abgelegt wird und auf die entsprechenden Daten der Seite im RRAM zeigt, 
sobald dxe Seite innerhalb des kleinen Speichers (RRAM) verfUgbar ist 
Dadurch kann ein Zugriff auf die Seite erfolgen. Fehlt die Seite im RRAM ist 
auch kexne Referenz eingetragen. in diesem Fall muss die Seite erst von dem 
groCen (externen) Speicherraum in den RRAM kopiert werden. Hierzu kann eine 
andere bevorzugt aktuell nicht verwendete Seite gemaS dem vorstehenden Ablauf 
tiberschrieben werden. 

Das Kopieren kann dabei automatisiert, also ohne wesentliche Beteiligung 
durch den Seguenzer erfolgen, indem von der MMU ein DMA-Kontroller 
angesteuert wird. Diesem werden die entsprechenden Seitenadressen im RRAM und 
externen RAM, sowie die SeitengroEe durch die MMU zur Verftlgung gestellt (z. 
B. xn Register eingetragen) . 

Die ROP-pae besitzt einen Anschlufi an eine Konf igurationseinheit die die ROP- 
PAE entsprechend des ublichen Verfahrens konfiguriert und rekonf iguriert . In 
"™, b s f V ° rZUgten Ausft *™ns -ann die CT auf den I ram lesend und/oder 
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ZUgreif6n ' " Dat6n Und/0der C ° de fto d - tenser *« ^ zu 



5 Codelur a^T" bSVOrZU9ten ^-taltung kann die kop-paE selbstandig 

In einer bevorzugten AusfOhruna ist der tt?*™ -u 

. y iSC aer IRAM in mehrere Seamen te untert-Pi 1 1- 

bexspxeXswexse fur einige der folgenden Funktionen aufgeteilt sein: 
p!«" 2e ^r Cher ' (Z - B ' ftoR ^ ist — Datenspeicher, Heap. xo- 

^ pI u^ I" r ern ^ ^ tZW - CaCh6 ' Konfigurationen 
£Ur PAEs und/oder Busse, der Registersatz der ROP-pae 

15 ZciT T^" k6mien da2U f ° lgende ^teuermechanismen vorgesehen sein- 

sZ2 I V, f 6iCher: «* entsprechenden 

Speicherstellen (Rpp) . 

Stack: Stackzeiger auf die oberste SpeichersteiXe des Stack (Rsp) . 
gegebenenfalls auch ein FrampPninfov % 

U.B. xntex Pentium, £ka^ Ist ^ " ^ ^ ^ 

der CT und/oder - xmpXementierungsabhangig ein Zeiger innerhaib ■ der 
Konfxguratxonssteuerung der PAE zeigen 

Registersatz der IPAE: SoXite der Registersatz der PAE im Speicher 
untergebracht sein, wir dieser direkt durch die PAE ndt bevorzugt 
25 hardwaretechnisch fest vorgegebenen adressiert 

ti!i"r liChen f elCherbereiche ' «i« Datenspeicher, Puffer, TabeXXen warden 
typxscherwexse durch den Compiler oder Prograramierer aufgebaut. Die 

B^lT n l dleSSr Bere±Ch erf ° l9t ^ daS — fOhrende Program und/oder 
30 TTll Tl%T ±nnerhalb *** "-graces und/oder Betriebssystexns, 

berecnne" ZUhllfenahme der ^egistersatzes und der ALU des Seguenzers, 

IPA^sT T 11 ^ VariantS ^ IRAM k0tnplett ° der teiXweise, wie bei den 

ZZLZ C T^T n ' dUrCh aUSSrhalb ^ R ° P - PAE ~«-i«t. Far ggf . 

^ unterschxedXxche Segmente kannen unterschiedliche RAM-PAEs verwendet warden. 

ll.t^l beV " rZUgten ^^-taXtung konnen einige oder aXXe ' Segmente aXs 
aktxve Spexcher ausgestaXtet sein, aXso eine DMA und/oder MMU besitzen und 

IZ J T 9 Daten ±n ° der ^ d6n ±hrem Speich - ™ nach anderen 

40 f ^ °f r PeriE>herie ^ at - ^pieren. Insbesondere konnen sie die 

40 Funktxonen der Speicher aus der DE 199 26 538.0 aufweisen, z. B. FIFO, 

FunktxonT^ A ° CeSS : " t °" ^ Se9I " ent ei »~ ln 

Funktxon konf xgurxerbar und/oder durch den Seguenzer programmierbar ist. 

45 ? Sine v AUSfUhrUng kann IRAM als MuXti-Port Speicher ausgefuhrt sein. 

Dxeser kann den ggf. auch gXexchzeitigen Schreib- und/oder Lese-Zugriff durch 
mehrere Speicherzugrif f seinheiten auf den SpeicherinhaXt er.ogXichen 
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^ioher ZU9r p ffSeinheiten k0nnen beis ^ iels ^- -teme und/oder interne 
Peripherie, Prozessoren, andere PAEs sein. 

aLb^ b T nderen AUSfQhrun3 kann die W»P-«M als lokale und ggf. auch 
arbelte f ^^««^t ahnlich einer CT fur ROP-PAEs in der Umgebung 

dxe ROP-PAE nach den, aus der DE X96 54 846.2-53 bekannten Verfahren bei der 
Verwendung als lokal Konfigurationseinheit. Wird die ROP-PAE als globale 
Konfxguratxonseinheit verwendet, oder hat sie sehr viele lokale pL zu 
konfxgurxeren, wxrd bevorzugt das Verfahren nach der DE 196 54 593 5-53 
verwendet, das eine FIDMO-Funktionalitat aufweist und daher sehr viele auch 
unahh,n gige Kcnf igurationen verwalten kann. Die ROP-PAE adressiert gesteuert 
durch den Seguenzer/Microcontroller Konf igurationen im iram und konfiguriert 
dxese an PAEs und/oder sich selbst und/oder bestimmt den Ablauf des 

nlTlZZ S T CrOCO T° 11&r8 - B6VOrZUgt findet Merbei eine synchronisation 
ZllTIZ to H e ° rdneten Konfigurationseinheit (z. B. CT oder andere PAEs, 

» 199 26 e 538 e oTT ^^^^ C« "8 07 872.2. DE 100 28 397.7 . 
EXTRAM 1,1 R0P " PAE kaim K -"^tionen uber eines der 

EXTRAM-lnterfaces selbst laden und/oder Konfigurationen von einer 

Fun^iT" 116 ' 611 ;° nflarUratioase **» " <*er — CT Interface anfordern. Die 
Funktxonsweise kann ahnlich der Rekonf igurationseinheit in der DE 196 54 
846.2-53 sein. 



ZusammengefaSt ist der prinzipielle Arbeitsweise einer ROP-PAE ahnlich eines 
mcrocontrollersyste.es, dessen Busanbindung und/oder dessen Datentransf ers 
und/oder dessen Programxnablauf einem VPu-System entspricht. Mit anderen 
Worten handelt es sich urn eine Multiprozessoranordnung, deren Bussystem auf 
dem Prxnzxp der VPU-Architektur beruht. Die einzelnen Prozessoren werden von 
bevorzugt von einer Obergeordneten Steuereinheit (CT) verwaltet. Die 
DatenObertragung ist selbstsynchronisierend Ober die RDY/ACK Protokolle der 
Bussysteme. Als ein besonders wesentlicher Aspekt wird der gemeinsame 
Prozessorstatus angesehen, der Ober das Triggerbus system reprasentiert wird 
und den Status einer Menge von Prozessoren- reprasentiert, der unter den 
Prozessoren zur Ablauf steuerung ausgetauscht werden muS. Hierzu wird 
verwxesen auf DE 197 04 728.9, DE 101 39 170.6 und DE 101 29 237.6-53. 

Ebenfalls wird Schutz beansprucht fur ROP-PAEs, die zusatzlich zu ihrem 
Anschluss an die intemen Bussysteme des Arrays aus PAEs einen dedizierten 
Anschluss (lO-Channel) an ein uberregionales Bussystem aufweisen, das 
xnsbesondere Daten Ober lange Strecken innerhalb des Arrays ubertragt 
und/oder insbesondere einen direkten AnschluS an die Peripherie aufweist. Der 
AnschluS an die Peripherie kann dabei direkt erfolgen, indem z. B. das 

IZZtT b ^ eitS ^ Peripheren «°**oll entspricht oder uber entsprechende 
Protokollwandler zur Drrisetzung des Protokolls erfolgen. Das dedizierte 
Bussystem kann dabei bereits einem Industriestandard entsprechen, z. B. PCI, 
RapxdIO, Fxrewire. USB, Ethernet. RAMBUS, DDR-RAM, etc. urn somit einen 
.t 1 ™^" m * ^-^^ndigen Anschluss der peripheren Cerate zu ermoglichen. 
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Gegebenenfalls kOnnen auch in zwischengeschalteten XOAGs (vgl. DE 196 54 
595.1-53 ) Protokollkonvertierungen derart durchgeftthrt werden, dass ein 
internes vereinf achtes und ggf . proprieties Busprotokoll auf ein Oder 
mehrere komplexere externe Standardprbtokolle Ubersetzt werden 
Es soli besonders darauf hingewiesen werden. dass unter Peripherie auch 
ZZ2ll~T W6rden ' ^ ^ b6reitS Busprotokollen 

L e cn! U 1S : rfindUngS ^ S besonders relevant, dass PAEs auch mehrere 

Anschltisse an dedizierte Bussysteme aufweisen konnen. 

Desweiteren sind anwendungsabhangig auch Architekturen sinnvoll, bei denen " 
7 61116 Tellmen ^ PAEs Anschltisse au ein dediziertes Bussystem aufweist, 

Oder unterschiedliche PAEs nut einer unterschiedlichen Anzahl von Anschlussen 
an ggf. auch unterschiedliche dedizierte Bussysteme aufweisen. 

Die beschriebene Struktur kann durch erweiterte und verbesserte 
Halbleiterherstellungsverfahren und -strukturen besonders leistungsfahig 
xmplementxert werden, indem der Speicher auf dem physikalischen Chip raumlich 
Uber oder unter den logischen Funktionen (ALU, Steuerung, Busse, etc.) der 

«««>rdnet wird. Hierfur wird Schutz beansprucht 
Dazu wird uber der nach dem Stand der Technik bekannten ersten 
Halbleiterstruktur (z. B. Silizium) und der damit aufgebauten 
Transistorstrukturen eine Oder mehrere weitere Ebenen von 

Halbleiterstrukturen (Trausistorstrukturen) aufgebracht, die far zusatzliche 
Funktionen genutzt werden kSnnen. Beispielsweise kOnnen in einer ersten Ebene 
die Logik und Gatter der PAE-Funktion und in einer weiteren zusatzlichen 
Ebene die Speicherfunktionen implementiert werden 

In einer bevorzugten Bauweise werden die einzelnen Halbleiterschichten durch 
eme Isolierschicht voneinander getrennt. Die Isolierschicht kann 
Durchkontaktierungen (Viae) aufweisen, urn Signale zwischen den einzelnen 
Halbleiterschichten zu libertragen. 

Die Verdrahtungsstruktur kann je nach Anwendung unterschiedlich implementiert 
sein. Beispielsweise konnen direkt Uber jeder Halbleiterschicht 
Verdrahtungsebenen und/oder eine globale Verdrahtungs ebene, die alien 
Halbleiterschichten zugeordnet ist vorgesehen sein. 

Urn eine wirtschaf tliche Ausbeute zu erlangen, muss sichergestellt sein, dass 
die Gesamtschaltung, also alle Halbleiterstrukturebenen zusammen, eine 
hinreichend hohe Ausbeute erreichen. Desweiteren ist zu beachten, dass der 
Stromverbrauch, also die Verlustleistung, aller Halbleiterstrukturebenen 
zusammen innerhalb eines akzeptablen Bereiches bleibt, der zu keiner 
uberhitzung und dem damit verbundenen Ausfall der Schaltung fuhrt 
Es kann durch eine geeignete Zusammenstellung der Funktionseinheiten der 
einzelnen Halbleiterebenen den entsprechenden Anforderungen entsprochen 
werden . 

Beispielsweise ist fur die verges chlagene Architektur eine Ebene von 
Logikhalbleiterstrukturen und eine weitere Ebene von 

f P ™„f halbleiterStrUktUren vorzusehen, die ftir diese Anforderungen geeignet 
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sind. Wahrend die irregularen und wenig redundanten Logikhalbleiterstrukturen 
eine vergleichsweise hohe Fehlerquote mit hoher Verlustleistung aufweisen, 
konnen Speicherhalbleiterstrukturen vergleichsweise redundant mit niederer 
Fehlerquote und durch geeignete Speicherverf ahren (z . B. DRAM) auch mit 
geringer Verlustleistung implementiert werden. Es wird explizit darauf 
hingewiesen, daS es m6glich ist, Felder vorzusehen, bei welchen nicht alle 
Speicherpiatze und/oder alle Logikhalbleiterstrukturen voll funktional sind; 
es ist lediglich erforderlich, Mindestanf orderungen sicherzustellen und/oder 
eine ordnungsgemaSe Verwaltung. Redundanzen sind bevorzugt fur beide 
Strukturen separat zu betrachten. 

Die Aufbringung der mehrfach tibereinander liegenden Halbleisterstrukturen 
kann nach unterschiedlichen Verf ahren erfolgen. Neben dem bereits 
beschriebenen Verfahren des Aufbringens einer weiteren Halbleiterebene ttber 
einer Isolierschicht, was z. B. durch Aufdampfen und/oder Aufkristallisieren 
erfolgen kann, sind auch thermische oder mechanische Verbindungen mOglich, 
indem z. B. die auf zubringende Siliziumstruktur auf gelotet- oder aufgeklebt 
wird. Zum Aufieten eigenen sich beispielsweise auch Verfahren, die aus den 
Technologien zum Verbinden von Halbleiterchips mit Gehausen bekannt sind. 
Dabei handelt es sich beispielsweise urn Ref low-Lotung oder Thermokompression . 
Prinzipiell sind auch die einfache mechanische Verbindungsmethoden meglich, 
wobei sodann die Verdrahtung beispielsweise per Wirebond erfolgen kann. 
Voraussetzung hierfOr ist, dass die Siliziumstrukturen unterschiedliche 
GrQSen aufweisen, sodass die Drahte von einer Siliziumstrukturoberf lache zur 
nachsten gedrahtet werden konnen und, dass die Anzahl der Verbindungen 
vergleichsweise gering ist,- damit diese mittels Wirebond noch realisiert 
werden kOnnen. 

Zur Optimierung der Ausbeute kann insbesondere das Redundanz verf ahren nach DE 
197 57 200.6-33 angewendet werden. Es soli erwahnt sein, dass das Verfahren 
nach DE 197 57 200.6-33 fur alle PAEs vorgesehen werden kann, also z. B. fur 
ALU-PAEs genauso wie fur RAM- PAEs . Mit anderen Worten kannen fur samtliche 
PAEs das in DE 197 57 200.6-33 beschriebene Redundanzverf ahren angewendet 
werden. Auch die dortigen Textverf ahren sind implementierbar . 
Ftlr PAEs mit hauptsachtlich f eingranularen Strukturen, also z. B. Speicher 
(RAM- PAEs) oder FPGAs ist es von Vorteil, diese f eingranularen Strukturen mit 
einer entsprechend f eingranularen Redundanz zu versehen, d. h. nicht oder 
nicht nur die RAM-PAE oder eine eine FPGA-Struktur aufweisende PAE mit einer 
redundanten PAE zu versehen, sondem die f eingranulare Struktur selbst mit 
Redundanz zu versehen. Das heisst, dass beispielseise den Speicherzellen 
(bzw. FPGA-Zellen) redundante Speicherzellen (bzw. FPGA-Zellen) zugeordnet 
werden. Die Verbindungen (Leitungen, Busse, etc.) zwischen den jeweiligen 
Zellen sind dann entsprechend an die Erf ordernisse einer redundanten Struktur 
angepaSt. Der Aufbau redundanter Strukturen ftlr f eingranulare Zellen, wie z. 
B. Speicher oder FPGAs ist durch den Stand der Technik bereits bekannt. Fur 
das Verstandnis von Ausgestaltungsdetails wird auf diesen verwiesen. 
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Die Verlustleistung last sich nach den Verfahren von DE 196 51 075 9-53 und 
DE 101 35 210.7-53 erheblich minimieren, wodurch sehr hohe 
Integrationsdichten ermeglicht werden. 

Es soil darauf hingewiesen werden, dass die Anzahl der tlbereinanderliegenden 
Halbleitersturkturen keineswegs auf zwei begrenzt ist. Mit fortschrei tender 
technischer Entwicklung und Optimierung ist eine steigende, auch sehr groSe 
Zahl von tlbereinanderliegenden Ebenen realisierbar. 

Die Ebenenaufteilung mu£ dabei, weder bei einer zweilagigen, noch bei einer 
mehrlagigen Struktur auf eine ALU-Speicher-auf teilung limitiert sein. Bereits 
bei zweilagigen Strukturen kann es sinnvoll sein den Speicher zusammen mit 
den ALUs in eine Lage zu legen und die andere Lage komplett fur die 
Bussysteme Oder die Bussysteme und IO-Ansteuerungen (lOAGs) zu verwenden Die 
Bussysteme kOnnen dabei tlber die einfache Verdrahtung hinaus bevorzugt auch 
die Schaltelemente (Multiplexer, Transmission-Gates, etc.) und/oder 
VerstSrkerelemente (Treiber, etc.) und/oder Synchronisationselemente 
(RDY/ACK-Steuerung) , die jeweils Halbleiterstrukturen zu deren Realisierung 
benetigen en thai ten. 

Desweiteren kann es sinnvoll sein, eine Ebene fur die Konf igurationsspeicher 
und/oder Konf igurationsreglster und/oder CT und deren Speicher vorzusehen. 

Figur 6 zeigt eine Implementierung einer ROP-PAE. Architektonisch wurde die 
RAM-PAE innerhalb der ALU-PAE implementiert . Der gesamte Registersatz 
(R0..Rn, Rpp, Rgp, RfP/ Rap) ist in der rop-pae. untergebracht . Zugriffe auf 
d le Register durch die ALU sind schnell und mit geringem Auf wand mBglich. 
Adressen und Daten kSnnen direkt von der ALU an den Speicher Obertragen 
werden, ohne ein Bussystem auSerhalb der ROP-PAE wie z. B. 0105 zu benotigen. 
Bevorzugt weist eine ROP-PAE einen oder mehrere dedizierte XO-Channel zur 
Datentibertragung mit der Peripherie auf (beispielsweise 0601, 0602). 
Datenverbindungen zu den restlichen PAEs kSnnen wie bereits bekannt durch 
FREG und/oder BREG realisiert werden. Hier angedeutet durch den Leseport 0603 
und Schreibport 0604. 

Bevorzugt sind ROP-PAEs bereits intern als Sequenzer ausgebildet und weisen 
danut bereits eine interne Rtlckkopplung des ALU-Ausgangs auf die Register 
auf. Optional kann dies auch durch die Verwendung eines ROP-PAE extemen 
Busses (z.B. 0105) und einer Rtickkopplung durch ein BREG, wie bereits bekannt 
erfolgen (0605). 

Figur 7 zeigt verschiedene Aufbauvarianten von Halbleiterstapeln: 
Figur 7a zeigt einen einfachen Aufbau mittels Wirebond Verbindungen zur 
Datenabertragung (0701), bei welchen zwei Dice (0702, 0703), also zwei Chips, 
aufeinander montiert sind. Ein Chip besteht stark vereinfacht aus einer 
Halbleiterebene zur Realisierung von Transistoren (z. B. Silizium, 0704), 
mehreren Metalllagen zur Realisierung von Verbindungsleitungen (z.B. 
Aluminium und/oder Kupfer; dargestellt sind 3 Lagen 0705a, b, c) , die jeweils 
u. U .^^ ne Isoliersch icht untereinander und gegenliber 0704 elektrisch 
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getrennt sind, und eine obere, besonders widerstandsfahigen Isolierschicht 
0706. in die Isolierschichten sind Durchgangsleitungen aus Metall zur 
elektrischen Verbindung der einzelnen Ebenen, sogenannte Vias, eingeftigt. 

in Figur 7b sind die beiden Dices mittels einer Art Flip-Chip-Technologie 
mteinander verbunden, wobei die Obertragung von Signalen durch sogenannte 
Bumps nach dem Stand der Technik erfolgt. Zusatzlich zu den durch die Flip- 
Chip-Technologie gegebenen Moglichkeiten des AnschluS von Bumps (0711) auf 
der 3 eweils obersten Metalllage soil hier die besondere erf indungsgemafie 
Ausgestaltung gezeigt werden, die Bumps unterhalb der Halbleiterschicht (z B 
Silizium) zu kontaktieren. Dazu werden elektrische Verbindungen (z.B. 
Alummium Oder Kupf er) . also Vias (0712), durch die Siliziumschicht nach 
unten geftlhrt. Die Durchftlhrung erfolgt bevorzugt durch Atzen von 
entsprechenden Lochern in die Halbleiterebene. Zwischen den Verbindungen und 
15 der Halbleiterschicht wird eine Isolierung eingeftigt. 

Die Durchftlhrung kann wie bei Figur 7d angedeutet entweder direkt durch die 
Halbleiterschicht erfolgen oder es werden, wie bevorzugt, zunachst Wannen 
(0731) in die Halbleiterschicht geatzt, die mit einer Isolierung geftlllt 
werden und in welche dann die Vias eingebracht werden. 

Figur 7c zeigt die besonders bevorzugte Variante zur Realisierung von 
Halbleiterstapeln. Oberhalb der obersten Isolierschicht (0721) einer ersten 
Halbleiterstruktur, die in diesem Fall dilnner ausf alien kann, wird eine 
weitere Halbleiterebene (0722) aufgebracht. Dazu wird die Isolierschicht 
(0722) zunachst durch Atzen und/oder Schleifen moglichst eben gemacht. Das 
Aufbringen der Halbleiterschicht kann durch Aufdampfen, Aufziehen von 
Kristallen Oder bevorzugt durch Aufkleben oder klebeahnlichen Verbindungen 
aufgebracht. Wesentlich, v.a. bei der Verwendung von Verklebungen ist, dass 
durch die aufgebrachte Halbleiterstruktur und das Verbindungsmaterial (z.B 
Klebematerial) durchgeatzt werden kann. Die Durchatzung ist erf orderlich, um 
Kontakte, wie in Fig. 7b beschrieben zu den Vias in der darunterliegenden 
Isolierschicht zu ftlhren. 

Die DurchfUhrung der Kontakte erfolgt gemafi Figur 7d z . B. durch das Einatzen 
.schmaler Kanale, in die ein Isoliermaterial eingebracht wird. Danach wird in 
einem weiteren Schritt in das Isoliermatierial ein schmaleres Via eingeftigt, 
mdem z. B. zuvor in dem Isoliermaterial ein Doch entsprechenden Durchmessers 
z. B. durch Atzen erzeugt wurde. 

Das bevorzugte Verfahren sieht das Atzen grosserer Wannen (0731) vor, welche 
nut Isoliermaterial gefullt werden. In die Wannen werden dann ggf . mehrere 
Vias (0712) wie beschrieben eingeftigt. 

Die Figuren 7e,f,g,h zeigen verschiedene bevorzugte funktionale Aufteilungen 
solcher Halbleiterstapel . Die Halbleiterebene ist jeweils schraf f iert 
dargestellt und die Isolierschicht durch dicke Umrandung. Dazwischen liegen 
die Metalllage. Wie in Fig. 7g,h angedeutet ist die Konstruktion nicht auf 2 
Stapel beschrankt, ebenso sind gr6Sere Stapel, z.B. mit 3,4, oder mehr Ebenen 
mdglich. 
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Die mehrfache beschriebene Auftrennung zwischen Speicher und ALUs ist in Fig 
7e dargestellt. 

Fig. 7f zeigt die Trennung der Bussysteme mit den notwendigen Schalteinheiten 
und der IO-Struktur von den ALUs und Speichern, die sich in diesem Beispiel 
in derselben Ebene befinden. 

In Fig. 7g liegen auf der untersten Ebene die ALUs. Auf oberster Ebene liegen 
die Speicher und ggf . die Treiber der 10. Somit sind die Strukturen mit hoher 
Verlustleistung an den auSeren Randern der Stapel untergebracht . Besonders 
luerftir wird Schutz beansprucht, da dadurch eine besonders optimale 
warmeabfuhr meglich ist. Die Bussysteme und deren Schalteinheiten sind in der 
mittleren Ebene untergebracht. 

in dem Beispiel Fig. 7h sind in den mittleren Ebenen verlustleistungsarme 
Busse und Speicher untergebracht. ALUs und die besonders energieaufwendigen 
10 sind zur optimalen Warmeabfuhr in den Randern untergebracht. 

IOx-PAEs 

Aus DE 199 26 538.0 sind Speicher (lORAM-PAEs) mit einem dedizierten 
Anschluss an exteme Einheiten wie z.B. Peripherie und/oder Speicher bekannt. 
Weiterhin sind aus DE 195 54 595.1-53 und DE 102 06 653.1 dedizierte 
Einheiten {z. B. Interf ace-Baugruppen (IBG) ) zum Anschluss von externen 
Einheiten wie z. B. Peripherie und/oder Speicher bekannt. 

Beide Verfahren weisen das Problem auf, dass ein zusatzlicher Aufwand zur 
Datenkommunikation zwischen PAEs, insbesondere datenverarbei tender und/oder 
datenberechnender PAEs und externen Einheiten betrieben werden muss, indent 
die Daten explizit zwischen den PAEs und den IBGs und/oder IORAM-PAEs 
Ubertragen werden mtlssen. 

Es wird nunmehr erf indungsgemaS vorgeschlagen und wie bereits vorstehend 
mehrfach erwahnt fdr beliebige PAEs, insbesondere jedoch fur 

datenverarbeitende und/oder datenberechnende PAEs (z. B. ALU-PAEs nach DE 196 
51 075.9-53 , IPAEs, ROP-PAEs) und datenspeichernde PAEs (RAM- PAEs nach DE 
100 50 442.6 ) einen oder mehrere dedizierten Anschliisse (IO-Channel) an 
externe Einheiten wie z. B. Peripherie und/oder Speicher vorzusehen. Dadurch 
ist eine direkte KommunikationsmSglichkeit der PAEs, die nachfolgend IOx-PAEs 
genannt werden, und externen Einheiten gegeben. Der Vorteil dieser 
Architektur liegt darin, dass die Verbindung des Arrays aus PAEs (PA) mit der 
Peripherie (extemem Speicher und/oder IO-Einheiten) erheblich effizienter 
aufgebaut werden kann. Die bestehenden konf igurierbaren Bussysteme der PAEs ' 
untereinander (BUS) milssen nicht mit den IO-Daten trans f ers belastet werden. 
Desweiteren kann bei einer entsprechenden Ausgestaltung des IO-Channel die 
Adressierung der Daten fur oder einzelne PAEs sehr viel einfacher 
durchgefUhrt werden, als dies mittels des BUS moglich ware. 
Dies kann bevorzugt dadurch realisiert sein, dass jede an einen IO-Channel 
angeschlossene Einheit eine eigene eindeutige Adresse besitzt. Mittels dieser 
Adresse kann jede Einheit explizit und einfach angesprochen werden, indem die 
» d .It!f,t aber dSn I0 - Channel ubertragen wird und jede Einheit diese Adresse 
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auT^sIL 1 : 1 ^!-^^ 8 VOrSeh6n «r nu r eine Teil^enge 

lO-cha^fl Beis P-^weise bietet es sich an, nur streifen von PAEs Jt 

10 vo Chan ° el - ErWeite —9 innerhalb einer Anordnung von PAEs (PAE-Array PA) 

^r^xlT wi r d eine « ~— - -stenefftlxL 

erreTSt! Xmpleinent — S «« IO-channel-Erweiterung in alls PAEs 
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5 IZl^illlZT 3 h ° h \ KOI ™ ikati — forderungen aufweisen, kSnnen 
applxkatxonsabhangxg auch an mehrere lO-Channel angeschlossen sein. 

aufgebaut sein, 2 . B. insbesondere nach DE 197 04 742 4 oder als LJ^Ti 
Standardbussystem wie Rapid-10 PCI amba . Paralleles 

» wie USB, Firewire, Ethernet. -rxelles Standardbussystexa 

Besonders leistungsfahig kann die Implementierung von 10-Channels in PAEs 
dann sexn. we „n diese nicht direkt an die externen Einheiten gefUhrt s^d 

ZtZlT 6ine ^-i—it <IOAG>, die ahnlxch lei 

Protokollkonverter nach DE 102 nc i j ^ 

„ - ^ 2 05 653 - 1 oder <ier IOAG nach DE 196 54 595 l- 

53 aufgebaut sein kann. Der Vorzuo lieat a . 595.1- 

Busprotokoll z U r ^» I vorzug Hegt dann, dass em einfaches internes 

nur llTl • Steueru *9T der 10-Channels verwendet werden kann. Ebenso wird 
b^t": : o T e h", IntelligenZ " in jeder ^ 10 - Ch ^ aufweisenden PAE 

p™; e :r s r L h d die paes jeweiis «— «-» - — g zu 

roAr ei r nt i iChe VerWaltUn 9 ™> Ansteuerung der externen Einheiten wird in den 
XOACs^ durchg efahrt, die durchaus grofie r und aufwendiger ausgestaltetlin 

SkrokonLor" T ErfU11Un * ±hrer Auf ^ -Ibst eigene Seguenser und/oder 

SnOAnu rLrh 99 ' ' aUCh 6i9enen SPSiCher aUfWe±Sen - ^-ndere kann 
axe IOAG auch Spexchenuanagementeinheiten und AdressUbersetzungseinheiten 

?n"™L T f (i8259> ^ IOAG -Pl—tiert sein, die 

interrupts ggf. auf Triggers ignale nach DE 197 04 728.9 Obersetzen. 

SIMD PAEs 

Ai e aorrL VerWSndUn9 rekonfi ^«^en Technologien zur Verarbeitung von 
^ ^ r tSteht ^ tl±CheS -aradoxon: (1, es sind, u, eine 

d!r Auf Re<=henleistu ^ ™ -halten, kcplexe ALUs erf orderlich, wobei 

fUr d±e Hekonfiguration minimal sein sollte; (2, es sollten die 
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ALUs maglichst einfach und feingranular sein, um eine effiziente 
Datenverarbeitung auf Bitebene zu ermoglichen; (3) es sollte die 
Rekonfiguration und Datenverwaltung derart intelligent und schnell erfolgen, 
daS sie effizient und einfach zu programmieren ist. 

Bisherige Technologien verwenden entweder a) sehr kleine ALUs mit wenig 
Rekonfigurationsunterstiitzung (FPGAs) und sind auf Bitebene effizient oder b) 
grofie ALUs (Cameleon) mit wenig Rekonf igurationsunterstutzung, Oder c) eine 
Mischung aus grofien ALUs und kleinen ALUs mit Rekonf igurationsuntersttitzung 
und Datenverwaltung (VPUs) . 

Da die VPU-Technologie die leistungsfahigste Technik darstellt, soil auf ihr 
aufbauend ein optimiertes Verfahren geschaffen werden. Es soil ausdrUcklich 
darauf hingewiesen werden, daS dieses Verfahren ebenfalls fur die anderen 
Architekturen eingesetzt werden kann. 

Der Flachenaufwand zur ef fizienten Steuerung von Rekonf igurationen ist mit 
einer Menge von ca. 10.000 bis 40.000 Gattern pro PAE vergleichsweise hoch. 
Unterhalb dieser Gattermenge lassen sich in der Regel nur einfache 
Ablaufsteuerungen realsieren, die die Programmierbarkeit von VPUs erheblich 
einschranken und eine Verwendung als General Purpose Prozessor erschweren. 
Sofern auf eine besonders schnelle Rekonfiguration abgezielt wird, mtlssen 
zusatzliche Speicher vorgesehen werden. wodurch die erf orderliche Gattermenge 
nochmals erheblich ansteigt. 

25 Urn ein ordentliches Verhaltnis zwischen Rekonf igurationsaufwand und 

Rechenleistung zu erhalten, ist somit der Einsatz von grofien ALUs • (viel 
Funktionalitat und/oder groSe Bitbreite) zwingend erforderlich. Werden die 
ALUs jedoch zu grofi, sinkt die nutzbare parallele Rechenleistung pro Chip. 
Bei zu kleinen ALUs (z. B. 4-bit) ist der Aufwand zur Konf iguration 
aufwendiger Funktionen (z.B. 32-bit Multiplikation) zu hoch. Insbesondere der 
Verdrahtungsaufwand wachstin kommerziell nicht mehr sinnvolle Bereiche. 
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SIMP Rechenwerke 

Urn ein ideales Verhaltnis zwischen der Verarbeitung von kleinen Bitbreiten, 
Verdrahtungsaufwand und der Konf iguration aufwendiger Funktionen zu erhalten, 
wird nun der Einsatz von SIMD-Rechenwerken innerhalb von ALU-PAEs (also 
insbesondere der in dieser Erfindung offenbarten PAEs, ebenso wie in PAEs 
nach DE 196 51 075.9-53 und DE 199 26 538.0 ) vorgeschlagen . Dabei werden 
Rechenwerke der Breite m derart zerteilt, daS n einzelne Blocke der Breite b 
= m/n entstehen. Durch Konf iguration wird je Rechenwerk vorgegeben, ob ein 
Rechenwerk unzerteilt arbeiten soil, oder ob das Rechenwerk in einen oder 
mehrere Blocke, jeweils gleicher oder unterschiedlicher Breite zerlegt sein 
soil. Mit anderen Worten kann ein Rechenwerk auch derart zerlegt sein, daS 
innerhalb eines Rechenwerkes unterschiedliche Wortbreiten zugleich 
konfiguriert sind (z.B. Breite 32-bit, zerlegt in 1x16-, 1x8- und 2x4 -bit ) . 
Die Daten werden derart zwischen den PAEs ubertragen, daS die zerlegten 
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Datenworte (SIMD-WORD) zu Datenworten der R ffh„ j( .„ 

und a i« ° rCen der Bxtbreite m zusammengef a£t werden 

und ale Paket titer das Netzwerk Obertragen werden. 

Das Netzwerk Ubartragt inuuer ein koraplettes Paket, d.h. alle Datenworte 

ZltlZ T T eteS ' ^ ^ tek — Hands h ake-;;::inren 

ZZ I T' ^tenworte innerhalb des Paketes k6nnen dabei auch 

"I Se±n ' d - h - keine ^forn.ation enthalten. Dies kann durch zusatzliche 
realt t^: ma "" mK *■ ». — RD^ACK Protokoll 



10 



20 



SIMP B ussy sfcenng 

Iffiz1ente e n fi2i r ten *** SIMD "^^erken 1st eine flexible und 

effxzxente Urnsortxerung der SIMD-WORD untereinander innerhalb eines Busses 
Oder zwxschen unterschiedlichen Bussen erforderlich 

flLSirv!'^ naC \ FigUr llkSnnen d ~art modifiziert werden, daE eine 
Busse uL^ • ein2elnen SIMD - WO *° -QXlflh ist. Dazu werden die 

Tran!- T ^ P1 ^ MUltiPleXSr ' Bus ^alter. Transroissiongates. 

«-**ol»»d unter de* Begrif f Multiplexer zusanunengef aSc, 
entsprechend den Rechenwerken teilbar ausgelegt, derart da* durch 
Konfxguratxon die Teilung bestinunt werden kann. Hit anderen Worten wird 
bexspxelswexse nxcht ein Multiplexer der Breite „ pro Bus verwendet, sondern 
n exnzelne Multxplexer der Breite b = m/n. Es ist nunmehr m aglich, die 
Datenbusse fur b bit Breite zu konf igurieren. Durch die MatrLtruk^ der 

Hald^akff^V" BUSSe Werd6n l09iSCh dSrart ^n ge.einsa.er 

Handshake fur den neu geordneten Bus aus den Handshakes der ursprOnglichen 
Busse generiert wird. Beispielsweise kann ein RDY «r einen neu sort ^ 
lieferndirr " ^ ** D '*«*«*«°*' HDVs der Daten fur diesen Bus 

DateTTi^ J" ^"^^ Werden " o kann beispielsweise das ACK eines 

Daten Ixefemden Busses aus einer UND-Verknupfung der ACKs aller Busse 

x^Senti ' Daten Weite — ^iten. Prinzipiell sind bei der 

35 SIT ! Verknapfungen dergestalt zu wahlen, dass diese den 

35 swells verwendeten Busprotokollen entsprechen. 

xle^T" IT ^ finden ^ Verknupfungen der Handshakes 
xnnerhalb exnes 3 eden Busknotens statt. Dadurch wird es xnoglich, einem 

40 121111 7 TV'* ^ beStShend ^ n Teilb — -~ Breite b, bevorzugt 
W nur em Hand- shake-Protokoll zuzuordnen. 

in einer weiteren besonders bevorzugten Ausgestaltung werden samtliche 
Bussysteme xn der Breite b ausgestaltet, die die kleinste realisierbare Ein- 
45 d« PAE e D t te Tf te b SineS SIMD " WOrd entsprechend der Breite 

ZlllT ° at ? nP beSt6ht nUlmehr Sin ^"/Ausgangsbus aus m /b = n 

Texlbussen der Brexte b. Beispielsweise besitzt eine PAE mit 3 32bit 
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vonTta^ir, \ L ' AUSgan3sbusse bei ^einsten S IM D-Wortbreite 

von 8 tatsachlxch 3x4 8bit Eingangsbusse and 2x4 8bit Ausgangsbusse. 
Jeder der Texlbusse weist bevorzugt samtliche verwendeten Handshake- und 

5 197 04 728.9 und exn globales Reset Signal, etc. 

sZtliT 19 f T ^ V6rSendet bevorzugt dieselben Steuersxgnalen fur 
samtlxche n Teil-Busse. Eingehende Quittierungssignale aller Teilbusse werden 
bevorzugt mxteinander logisch verknapft. z. B. durch eine UND-Funktion. Ill 
) Bus^t " r n K 6den T6ilbUS ™* unabhangig routen. Ill 

lZZlT\ ^ S ° ndere BUSkn ° ten Ver " b6iten verknapf en die 

Handshake-Sxgnale der einzelnen Busse unabhangig ihres Routings, ihrer 
Anordnung und Sortierung nicht. 

TeilbusfT ^ eingehenden ° aten werd - «*• Steuersignale samtlicher n 
Texlbusse derart mxteinander verknapft, dass ein allgemeingUltiges 
Steuersxgnal quasi als Bussteuersignal far den Datenpfad generiert wird. 
Bexspxelswexse konnen in einer "dependend- Betriebsart RdyHold-Stuf en fur 
Deden exnzelnen Datenpfad eingesetzt werden und erst, wenn samtliche RdyHold- 

Xn exl T. T „T Si * nalisi —< von der PAE UbernonLn. 

In ner xndependend- Betriebsart werden die Daten jedes Teilbusses einzeln 
xn Exngangsregxster der PAE geschrieben und quittiert, wodurch der Teilbus 
lllT* T< na<=hSte DatenQbert ~^S frei ist. Das Vorhandensein aller 

tZZ^ll l J1TT allen T6ilbUSSen in «~ Bingangsregistern wird 

xnnerhalb der PAE durch geeignete logische Verknupfung der far jeden Teilbus 
xm Exngangsregxster gespeicherten RDY-Signale detektiert, woraufhin die PAE 
mxt der Datenverarbeitung beginnt. 

sllJllTlliTl daraUS rSSUltierende V - te " Verfahrens ist, dass die 

ZT' l T PAES kSinerlei besonderen EinfluS auf das verwendete 

TrltZZ^ ' BS Werflen ledi3licb ^ Busse (n, einer geringeren 

Brexte (b) bendtxgt. Die Verschaltung selbst bleibt unberahrt. Die PAEs 
vertoupfen und verwalten die Steuerleitungen lokal. Dadurch entfallt der 
zusatzlxche Hardwareaufwand in den Bussystemen zur Verwaltung und/oder 
Verkntipfung der Steuerleitungen. 

Figur 11 zeigt einen m6glichen und besonders bevorzugten Aufbau einer 
BusstruKtur far VPU-Architekturen. Die Ausgabeschaltung einer Funktionszelle 
z. B. (PAE , FREG/BREG) (1103, entspricht 0803a,b) ist Ober einen vertikalen 
Bus mxt dem horizontalen Bussystem (1102, entspricht 0105) verbunden 
Entsprechend greifen die Eingabeschaltungen der Funktionszellen (1101, 
entspricht 0801, 0802, aber einen vertikalen Bus Informationen von dem 
horxzontalen Bussystem ab. In der Figur wird nunmehr verdeutlicht, wie ein 
derartxger Abgriff , bzw eine derartige Aufschaltung erfolgen kann. 
Wxe xn Fxg. l la dargestellt erfolgt das Aufschalten eines Ausgabebusses 

Bu S siL V ° n n \\°, 3 1102 ^ " Auft — " eines Busses des horizontalen 

Bussystems 1102 und das EinfOgen von horizontalen Schaltern (1112), die durch 
Swxtches, Transmission-Gates, Multiplexer oder ahnlichen geeigneten 
f a ri^f nten reali ^ert sein konnen. Abhangig von dem Wert eines Dekoders 
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und/oder Konfigurationsbits (angedeutet durch das Schaltersymbol 1113), das 
entsprechend der bekannten Konf igurationsverf ahren bevorzugt in einem 
Konfigurationsregister der PAE angeordnet ist und konfiguriert wird, 
yerbindet der Schalter entweder die beiden Halften des horizontalen Busses 
1102 mxteinander oder schaltet den Bus 1111 auf die eine Halfte von 1102 auf , 
die andere Halfte von 1102 ist dann unterbrochen und wird nicht 
weitergeleitet. Die Schaltung wird bevorzugt fur jeden Bus des horizontalen 
Bussystems verwendet. 

Figur lib zeigt die entsprechende Schaltung zum Abgriff von Daten von 1102 
und zur Weiterleitung derer an 1101. uber vertikale Schalter (1122), die 
durch Switches, Transmission-Gates, Multiplexer oder ahnlichen geeigneten 
Bauelementen realisiert sein kbnnen. werden Daten bitweise von den Bussen des 
horizontalen Bussystems (1102) abgegriffen und auf den vertikalen Eingangsbus 
(1121) zur Eingabeschaltung 1101 ubertragen. Die Ansteuerung der vertikalen 
Schalter, d.h. ihre Schaltfunktion, erfolgt durch Dekoder und/oder 
Konfigurationsbits (angedeutet durch die Schaltersymbole 1123), die 
entsprechend der bekannten Konf igurationsverfahren bevorzugt in 
Konfigurationsregistem der PAE angeordnet sind und konfiguriert werden 
Fig. lib und bei entsprechender Modifikation auch Fig. 11a lassen n.-l 
Datentibergange zu, d.h. mehrere Busse konnen zu einem Bus zusammengef aSt 
werden, d.h. die Daten mehrer Busse werden auf einem Bus zusammengefuhrt. 
Fxg. 11c zeigt die Busauf trennfunktion der horizontalen VPU-Bussysteme 
(1102). Jeder horizontals Bus einzeln und je fiir sich kann an der 
Ausgabeseite der PAE-Kante aufgetrennt werden. Eine Auftrennung kann durch 
Multiplexer oder Schalter erfolgen, wie in Figur 11c angedeutet werden soli. 
CTe nach Konfigurationsbit 1132, das bevorzugt fur jeden Bus des Bussystems je 
einzeln zur Verfilgung steht, wird die Dateniibertragung auf das 
danebenliegende Bussystem (1131) freigeschaltet oder unterbunden. 
Typischerweise wird diese Funktion in den Schaltern nach Figur 11a 
realisiert, indem die Information des Konfigurationsbits 1132 an die Schalter 
(1112) des danebenliegenden Bussystems (1131) ubertragen wird und 
entsprechend die Schalter zur Weiterleitung ermachtigt (enabled) oder die 
Schalter sperrt (disabled) . 

Figur 12a zeigt ein SIMD-Bussystem entsprechend Figur 11. Dargestellt ist ein 
vereinfachtes horizontales Bussystem 1102, eine PAE Ausgabeschaltung 1103 und 
eine PAE Eingabeschaltung 1101. Jede Eingabeschaltung weist beispielhaft 2 
Eingabebusse der Breite 32 bit auf (1201, 1202), jede Ausgabeschaltung 2 
entsprechende Ausgabebusse (1203, 1204). Jeder der Busse (1201, 1202, 1203, ' 
1204) ist in 4 Teilbusse zu je 8-bit aufgeteilt, die wie dargestellt jeweils 
unterschiedlich und unabhangig geroutet werden kSnnen, einige der Teilbusse 
werden nicht verwendet (gepunktete Linie) . Die flexible Verschaltung wird 
dadurch erreicht, dass die Schalter nach den Figuren lla-c'ftlr jeden Bus 
derart getrennt aufgebaut sind, dass je ein Teilbus von einem Schalter mit 
eigener Konf iguration verwaltet wird. Dadurch ist das Bussystem feingranular 
verschaltbar. 
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^/f 6Xne SI ^-^tenverarbeitung, bei welcher samtliche Busse 

pae in ZTlX HanaS ^ U212} aUfWeiSen - ° ie BUSSe Wer<3en ^ 
v^arfcJtet n ^ *" (1213 < 1214 > setrennt 

gemeinSamen Handshakes steuern die Ablauf steuerung (1215, 
der PAEs an, bzw. werden von dieser generiert. 

Figur 12c zeigt eine SIMD-Datenverarbeitung, bei welcher samtliche Busse 
Zst « 9 eimt Slnd <1221) 9et — te Handshakes (1222, aufweisen. Die 
IZTJl _MlUS (1223 ' 1224> getrennt verarbeitet. Die getrennten 



Einsafcz vnn FPGAs al g ATJT-fW Q 

15 In PACTH 1st bereits sine Architektur beschrieben, in welcher anstatt einer 
ALU exne FPGA oder FPGA-ahnliche Struktur in eine PAE integrlert wird' Diese 

deTst iimerhalb ~» " FPGA Konfiguracionsn.ethoden Zl 

dem Stand der Technik konf iguriert, d. h. die erweiterten 

20 ^;r r t i0nSVer fahrSn naCh PACT ° 2 ' ° 4 ' ° 5 ' 10 ' 13 ' " finden auf die FPGA- 
20 struktur kexne Anwendung. Dadurch sind Aufwand und Kosten fur die 

Z llZZZTTl^ 3 Verhaltais - Si ^ ^einen FPGA-Zellen gering. Die 

PAE allerdxngs, dxe dxe FPGA-Zellen enthalt, verhalt sich gemaS des VPD- 
Konfxguratxonsverfahrens nach den o. g. Schriften. Dadurch 1st die FPGA- 

25 irti T " d ^. PAE " StrUktUr gSkapSelt «* v**lt sich wie ein PAE-Objekt 
25 nut vielen Konf igurationsregistern. 

Dadurch lassen sich auch beliebige Operationen auf ein Array aus FPGAs 
abbxlden. GemaS DE 101 35 9-in i c-a • . 

PAE S „ ^ 210.7-53 ist exne Mischung aus ALU-PAEs und FPGA- 

PAEs xnnerhalb exner VFU moglich und durchaus sinnvoll. 
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2 f • ^ ndungsgebietes zu entscheiden, ob ein mehrfacher Satz 

TeZ llT ST'T^™ "* FPGA - Ze11 - si—11 ist, da deren Anzahl 
sehr hoch xst. Gegebenenfalls werden Konf igurationsregister zum schnellen 
Uxnkonfxgurxeren einer F PGA- PAE gemaG DE 196 51 075.9-53 . DE 199 26 538 0 

TrZT S ° a *TZ E 28 39? - 7 P±g - 18 TOd 19 als Lister-File oder FXFO- 
Struktur xnnerhalb der PAE realisiert und von dort aus in die FPGA- 2 ellen 
gelaaen . 

lL~t mittlerWeile als ^onaers vorteilhaft herausgestellt, wenn 

tZt ltlT Rer FPGA StrUktUr ^ wird, indem die 

b™^ T! ^ naCb Und/ ° der Parallel 2Ur -geordnet wird. 

Bevorzugt xst exne AusfUhrung in welcher die FPGA-Struktur der ALU 
nachgeschaltet wird. 

Der Vorteil liegt darin, das S nur relativ kleine FPGA-Strukturen verwendet 
werden mussen, da samtliche arithmetischen Operationen weiterhin in der ALU 
ablaufen. Dadurch wird eine besonders hohe Kosten/ Performance Effizienz 
errexcht Urn kleine Wortbreiten zu unterstutzen (4-bit, 8-bit, etc.,, bietet 
r™ C L beS ° nderS an ' die beschriebenen SIMD-ALUs einzusetzen. 
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Durch die Nachschaltung von FPGA-Strukturen hinter einer ALU lassen sich 
insbesondere Correlatoren und PNG- Generator en besonders effizient aufbauen. 

Der Einsatz von VPU Architekturen bietet sich mittlerweile' insbesondere fur 
5 den Ersatz von ASICs bei mittleren und niederen Stttckzahlen an. Dieses 
Einsatzgebiet der VPU Bausteine weist die Besonderheit auf , dass die 
Applikationsfelder sehr klar definiert sind und haufig nur einige wenige 
Applikationen auf den Bausteinen ausgefuhrt werden. Besonders diese 
Einsatzgebiete benOtigen haufig f eingranulare FPGA-Strukturen zur bitweisen 
10 Verarbeitung von Daten. 

Durch die Limitierung auf wenige Anwendungen sind hier die mSglichen 
Konf igurationen der FPGAs ebenfalls sehr begrenzt und vorhersagbar . 
Es wurde erkannt, dass es beispielsweise insbesondere fur diese 
Einsatzgebiete lohnend ist, die Rekonf iguration der FPGA-Strukturen von der 
15 schnellen Rekonf iguration der grobgranularen Strukturen abzusetzten. Mit 

anderen Worten werden fur die FPGAs langsamere (z. B. herkSmmliche serielle) 
Rekonf igurat ions verfahren verwendet, die aufcerst kosten- und f lachenef f izient 
realisierbar sind. 

Dazu kann (1) ein vollkommen separates Konf igurationssys tern bestehend aus 
20 Bussystem und Konf igurationskontrollern aufgebaut werden, wie dies von FPGAs 
nach dem Stand der Technik bekannt ist. (2) konnen die 

Konfigurationsressourcen der VPU Technologie benutzt werden, ohne dass jedoch 
Ressource fur besondere beschleunigende Massnahmen zur Verfttgung gestellt 
werden. Beispielsweise kann der Zugriff auf den FILMO nach' DE 196 54 593.5-53 

25 , DE 198 07 872.2 fur FPGA-Strukturen ausgeschlossen sein, ebenso wie das 

Vorhandensein von Konf igurationsregisters tacks nach DE 100 28 397.7 oder wie 
nachfolgend beschrieben. Ebenfalls kann die Untersttttzung der schnellen Wave- 
Rekonf iguration nach DE 199 26 538.0 , DE 100 28 397.7 entfallen. Es ist 
etwa mBglich, einem F PGA- Array eine PAE zur Umkonf igurierung zuzuordnen. Hier 

30 mufi lediglich die PAE dazu konfiguriert werden, die FPGA-Struktur zu laden, 

was wie vorstehend beschreiben, durch PAE-gesteuerten, eigenstandigen Zugriff 
auf Daten von auSen geschehen kann. 

Insbesondere bietet es sich aus Kos tengrtinden an anstatt der mehrfach 
rekonf igurierbar en Architekturen ressourcensparende "einmal konf igurierbare" 

35 Architekturen einzusetzen. Die VPU-Bausteine werden dann einmal vor ihrer 
Auslieferung an den Kunden oder beim Kunden bzw. durch den Kunden 
personalisiert, d. h. die FPGA-Strukturen werden auf ihre durchzufuhrende 
Funktion konfiguriert. Die Funktion der FPGA-Strukturen ist sodann im 
weiteren unabanderlich, wahrend samtliche verbleibenden Funktionen, wie die ' 

40 der ALUs und deren Vernetzung, weiterhin vollstandig lauf zeitrekonf igurierbar 
entsprechend der VPU-Technologie ist 

Als "einmal konf igurierbare" Technologien bieten sich besonders die bekannten 
ROM, EPROM, EEPROM, FLASH basierenden Verfahren an. Es soil insbesondere 
erwahnt sein, dass sich die bekannten Fuse und Ant i fuse -Verfahren (z.B. 
45 Atmel, Actel, Quicklogic) besonders zur Realisierung derartiger -einmal 
programmierbarer" FPGA-Strukturen eignen. 
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Auf den prinzipiellen Aufbau derartiger Strukturen soil hier nicht weiter 
eingegangen werden, da dieser durch den einschlagigen Stand der Technik, 
insbesondere den Patenten der o. g. Firmen, hinreichend bekannt ist. 

5 Figur 8 zeigt beispielhaft eine erf indungsgemaSe PAE. Dargestellt ist der 
Datenpfad der PAE. Die Verbindung zu dem Bussystem 0105 wird durch die 
bevorzugt Register enthaltende Eingabebaugruppe 0801 und 0802 und die 
ebenfalls bevorzugt Register enthaltende Ausgabebaugruppe 0803 realisiert. 
Der ALU (0804) nachgeschaltet ist eine Funktionseinheit aus f eingranularen 

10 FPGA-Zellen (0805), die liber einen Busstruktur miteinander verbunden sind. 
Der Ausgang von 0804 wird auf diese Busstruktur aufgeschaltet , die 
• Busstruktur wiederum ist rait 0803 verschaltet. Optional und bevorzugt kann 
mittels eines Multiplexers ein Bypass des Ausgangs von 0804 direkt auf die 
Ausgabebaugruppe 0803 an 0805 vorbei geschaltet werden. 

15 In die FPGA-Zellen kSnnen mehrere Stufen Logik konfiguriert werden, 

insbesondere samtliche oder einige der folgenden Funktionen: Multiplexer, 
AND, OR, XOR, NOT Funktionen, Halb- addierer, Vergleicher, Schieberegister, 
Register, Boolsche Lookup-Tabellen. 

Die FPGA-Zellen (0805) konnen durch den Konf igurationsbus (0404) der PAE 
20 konfiguriert werden. Bevorzugt werden besondere konf igurationsbeschleunigende 

Baugruppen, wie z. B. Konf igurationsstacks (0406) nicht zur Konf iguration von 

FPGA-Zellen benutzt. Diese Baugruppen werden ggf . far derartige 

Konf igurationsda ten passiv geschaltet oder die Konf igurationsda ten werden an 

ihnen vorbeigeleitet . 
25 In einer besonderen Ausgestaltung ist eine permanente einmalige Konf iguration 

der FPGA-Zellen unter Verwendung von ROM-Elementen wie z. B. EPROM, EEPROM, 

Flash-ROM oder Fuse-/Antifuse-Technologien vorgesehen. 

Figur 9 zeigt mogliche erf indungsgemSSe Ausgestaltungen von PAEs. Es soil 
30 ausdrtlcklich darauf hingewiesen werden, dass die Ausgestaltung in Figur 9a 
und die in Figur 9b auch gleichzeitig zusammen in einer PAE implementiert 
sein kSnnen. 

Figur 9a zeigt den AnschluS eines Registerf iles (0901) (z.B. RO. .Rn) an einen 
35 Kern (0902), der beispielsweise aus einer ALU wie 0804 oder einer ALU (0804) 
und FPGA-Zellen (0805) bestehen kann. 

Die Ergebnisdaten des Kerns werden zu den Regis tern 0901 gefuhrt und dort je 
nach Operation eingespeichert . Die Register 0901 werden Ober Muliplexer 
(0903, 0904) je nach durchzuf Ohrenden Operation auf die Eingange der ALU 
40 gefuhrt . 

Figur 9b zeigt eine ahnliche Struktur, bei welcher eine zusatzliche 
Aufschalteinheit (0911) fur einen dedizierten globalen Bus (0912) (z.B. 10- 
Channel) implementiert ist. Die Ergebnisdaten des Kerns werden zu der 
45 Aufschalteeinheit 0911 gefuhrt und dort je nach Operation auf den globalen 
dedizierten Bus (0912) ttbertragen. Fur die PAE bestimmte Daten von 0912 
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10 



warden tiber Muliplexer (0903, 0904) je nach durchzufuhrenden Operation auf 
die Emgange der ALU geftthrt. 

ZTZll nT ^ AUfSChalteeinheit ^ *ie Busaufschalteeinheiten 09X3 

und 0914 Daten dxrekt von dem Bussystem 0105 lesen oder auf dieses 
Ubertragen . 

Figur 10a zeigt die Verwendung von dedizierten globalen Bussystemen innerhalb 
exnes Arrays aus PAEs (1001). insoweit entspricht die Darstellung des PAs aus 
Fxgur 1 (0101). Jewells eine Menge von PAEs (1001) ist an die globalen 
dedxzxerten Bussysteme 1002, 1003, 1004 angeschlossen und kann Daten auf 
dxese Senden oder von diesen Empfangen. Die DatenUbertragung kann sowohl 
zwxschen den PAEs, als auch zwischen PAEs und IO stattfinden. Es ist 
dargestellt, dass PAE S auch an mehrere globalen dedizierten Bussysteme 

15 keln^ 2 ! 1 '^" 9 "^ 10 " 611 SSin k6lUlen ' WShrend • nd ~« PAES ^licherweise 
A3 icemen Anschluss aufweisen. 

Figur 10b zeigt beispielsweise den AuschluB eines globalen dedizierten Busses 
beispx elswexse 1002 oder 1003 oder 1004), der innerhalb des Arrays aus PAEs 
(0101, nut exnxgen PAEs (1001) verbunden ist, an auBerhalb des 0101 liegende, 
ggf. auch bausteinexteme Baugruppen. Die Baugruppen konnen beispielsweise 
Perxpherxe (1011) und/oder Speicher (1012) sein. Zum AnschluB der auBerhalb 
Ixegenden Baugruppen (1011. 1012) kann ggf. eine Anpassung der Signale (z. B. 
Spannungen: CMOS, TTL, I.VDS, etc.) stattfinden. 

Figur 10c zeigt ein Beispiel fur den AnschluB eines globalen dedizierten 
Busses (beispielsweise 1002 oder 1003 oder 1004), der innerhalb des Arrays 
aus PAEs (0101, nut einigen PAEs (1001) verbunden ist, an eine Interface- 
Baugruppe (1021, . Die Interface-Baugruppe Obersetzt die Protokolle und/oder 
Sxgnale des internen dedizierten Busses auf einen oder mehrere auBerhalb ' 

30 (loir x0 2 r Se \ In ^ aUf9SZeigten Beis P-l -nd 2 auBerhalb liegende Busse 
(1022, 1023, xmplementxert. Die Bussysteme sind bevorzugt unterschiedlicher 
Ausgestaltung, beispielsweise kann 1022 ein Speicherbussystem far Speicher 
(1024, wxe SDR-RAMs, DDR-RAMs, RAMBUS o.a. sein, w&hrend 1023 ein 
Perxpheriebussystem fur Peripherie- und/oder IG-Gerate (1025) darstellt, wie 
B. PCI oder ein serielles Protokoll wie USB, FireWire, Ethernet. 
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Konf iguration komplexgy RechpiwprV. 

Komplexe Rechenwerke (z. B. Floating-Point Rechenwerke) konnen durch die 
geexgnete Verschaltung und Gruppierung von konf igurierbaren Zellen (PAEs) 
maglxcherweise auch unterschiedlicher Bauart (RAM- PAEs, ALU-PAEs, Bussen) 
realisiert werden. 

Beispielsweise kann ein Floating-Point Rechenwerk durch eine geeignete 
Verschaltung von mehreren ALU-PAEs, die die arithmetischen Operationen Ober 
Exponent und Mantisse durchfahren erreicht werden. Bevorzugt werden den ALU- 
PAEs die in der VPU des Anmelders (XPP-Technologie) integrierten Forward- und 
Backward-Register (FREG/BREG) zugeordnet, urn die notwendigen Normierungen 

^,f.f hlebe ° perationen der in FREG/BREG angeordneten Barrel -Shifter 
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Basis 2 iT 83611 SiCh ^tl^-Polat Rechenwerke bei Bedarf auf 

Basxs der Integer-ALUs zoit hoher Flachenef f izienz aufbauen. 
Exn Vortexl des Verfahrens liegt darin, dass keine Siliziuxn-Plache fur fest 
5 ;^- te h F1 - t ^-°in t Rechenwerke verwendet werden muss. Da Plo^ 

wxrd, stexgt damxt das Kosten/Nutzen-Verhaltnis erheblich an 

^oexP-sxI ^^^^ «* *ine VPU Obersetzen, 'kannen durch 
Makroexpansxon und/oder mittels Laufzeit-Bibliotheken entsprechende 

10 ZZIZT* k0mPl6Xe ~~ ^ —-ode c. B. « . 

21 ^bliorr" 6 "^ 0 ^ B - NML> bi6ten SiGh beSOn<3 - s -ibrary-calls 

enth!lten ~' ^ ~ t ^«- l « F-ktionen vorgefertigt 



15 



Statemacbines tth^T- ram-pat^ 

Mit einem Array aus PAEs verbundene RAM-PAEs kannen zum Aufbau von Sequenzem 
exngesetzt warden. Bas Grundprinzip beruht darauf, dass Ausgangsdaten^eT 

20 TfoZTt deSSen AdrSSSein — -rUckgekoppext wird. Die Ruckkoppxung 

20 erfolgt bevorzugt uber ein taktgesteuertes Registers. Dadurch entst^t eL 

Z"'r*lZ: LT ±1S n — — - ^weiXs aktuexXen 

^d/IdfrV^ 95 ^' 611 (CONTROL - Si ^^) k6nnen nunmehr an andere Baugruppen 
25 ZZ Fu » kt — (PAEs) und/oder auch an externe Gerate ubertragen 

25 werden, u, dort bestx^te Vorgange auszuXasen. Besonders bevorzugt sind zwei 

Ubertragungsarten, die zumeist gemeinsam angewendet werden: 

tUTs ra3mig 6inen Datenbus < ^vorzugt inbesondere aXs SIMD-Bus 

gexnas der vorstehenden Erlauterung ausgestaXtet, wodurch eine teilweise 

30 « T"T AUS9 ^ s3at - besonders effizient realisierbar ist. 

tteertragUng ^ 6inen ^-sen bevorzugte Ausgestaltung und 

Btdxna^ 6136 " *T° 8 bSSChrieben ist - ^r. Triggerbusse kannen Zustande und 
^TT Ablaufsteue ^ -n Baugruppen und/oder Punktionszellen 

(PAEs, und/oder auch externen Geraten besonders effizient ubertragen werden. 



35 



Der Aufbau der Eingangsadressen, bzw. Ausgangsdaten ist wie 
folgt(DarsteUung: haherwertige Bits ... niederwertig Bits): 
Adresse : 

[Adresse des aktuellen Zyklus 
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Da ten: 

[Adresse des nachsten Zyklus 



CONTROL-Signale 



Es bXexbt zu erwahnen, dass die Eingangsdaten typischerweise nicht verwendet 
rZ T»Lt i SPSiCher Wlrd ^ l6Send ' niGht - h -^end zugegriffen. 

vorkonfrL JVTT " iZ ' B ' RAM " PAE) Wird dUrCh 6ine Konfigurationseinheit 
vorkonfxgurxert. Deshalb kann der Speicher insbesondere auch als 

^^? chti * er einm *l Programmierbarer Speicher mit ROM, EPROM, EEPROM 
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Flash Zellen oder basierend auf Fuse oder Antifuse Technologien aufgebaut 
sein. Der Speicher wird dann, wie vorab bereits beschrieben, vor der 
Auslieferung an den Kunden oder beim Kunden personal is iert, d.h. 
programmiert . 

Ein Speicherzugriff durch andere PAEs ist grundsatzlich m8glich, urn den 
Sequenzer z.B. im Betrieb zu modif izieren, soil aber aufgrund des begrenzten 
Einsatzbereichs hier nicht weiter detailliert ausgefOhrt werden. 



10 Der erfindungsgemafce Sequenzer kann durch folgende Erweifcerungen in seiner 

Abfolge von Zyklen auf Ereignisse reagieren und insbesondere bedingte SprOnge 
durchf uhren : 

Ein Teil, bevorzugt der niederwertige, der Eingangsadressen zu dem Speicher 
wird als Eingang far weitere Zustandssignale verwendet. Diese Zustandssignale 

15 k5nnen durch die vorstehenden tibertragungsarten Obertragen werden und somit 
Daten oder Trigger sein. Bei der Selektion des nachf olgenden Zyklus wird 
nunmehr eine mSgliche Menge von Zyklen durch die DatenrOckkopplung auf die 
bevorzugt hohen Adressbits bestimmt und der bestimmte Zyklus wird dann aus 
der mSglichen Menge durch die Zustandssignale auf den niederen Adressbits 

20 selektiert. 



25 



Daraus resultiert folgender Aufbau der Eingangsadressen, bzw. Ausgangsdaten 
wie folgt (Darstellung: hOherwertige Bits ... niederwertig Bits): 
Adresse : 



Adresse des 
aktuellen Zyklus 



Zu s t ands s i gnal e 



Daten: 



Adresse des nachsten Zyklus 



CONTROL- S i gnal e 



30 



Somit ist ein vollwer tiger Sequenzer definiert, der den Grundprinzipien der 
Mealy-Moore Sequenzern entspricht. 



Die Zustandssignale und/oder Control-Signale kGnnen nunmehr ggf . zu Bundeln 
zusammengefafit der art gruppiert werden, dass je eine Gruppe bestimmten 
Sendern/Empfangern zur Verftigung steht, z.B. eine Gruppe fiir 0101-interne 
PAEs und eine Gruppe fur externe Baugruppen und eine Gruppe zur 
35 Konf igurationseinhei t . 



Mit anderen Worten werden samtliche SprOnge durch die Angabe der "Adresse des 
nachsten Zyklus" realisiert. Bedingungen werden durch die Zustandssignale 
realisiert. 

Das dabei auftretende Problem ist, wie sog. don N t cares, also bestimmte 
Zustandssignale, ' deren Wert zu einem Zyklus bedeutungslos ist, behandelt 
werden. Die bevorzugte Variante liegt darin, far samtliche m6glichen Werte 
dieselben Daten festzulegen. 

11, ftpctabir 3002 . 1 



Akte: PACT31PCToe 



10 



15 



Beispiel : 

Innerhalb einer f olgendermassen aufgebauten Adresse 



Adresse des 
aktuellen Zyklus 



Zus tands s ignal e 



soil die "Adresse des aktuellen Zyklus" (Cycle) beispielhaft gleich 0x60, 
entsprechend CYCLE60 sein, Es sind 4 Zus tands s ignal e (ZS0..3) vorgesehen, von 
denen innerhalb des beispielhaf te Zyklus' 2 (ZS3 und ZSl) je nach Wert zu 
anderen Sprungzielen ftihren, also beispielhaft nach CYCLE10, CYCLE7, CYCLE 8 9 , 
CYCLES 6. 

Die Tabelle sieht nunmehr wie folgt aus : 



Adresse 


Daten 


Cycle 


ZS3 


ZS2 


ZSl 


zso 




CYCLE60 


0 


? 


0 


? 


CYCLE10 


CYCLES 0 


0 


? 


1 


7 


CYCLE7 


CYCLE 60 


1 


? 


0 


7 


CYCLE89 


CYCLE 6 0 


1 


7 


1 


7 


CYCLES 6 



Die don't cares (ZS2, ZSO) werden nunmehr so belegt, dass der Wert ihres 
Signales keinen Einflufi auf die Zuordnung der Adresse zu den Daten hat: 



Adresse 


Daten 


Cycle 


ZS3 


ZS2 


ZSl 


zso 




CYCLE 6 0 


0 


0 


0 


0 


CYCLE10 


CYCLE60 


0 


0 


0 


1 


CYCLE10 


CYCLE60 


0 


0 


1 


0 


CYCLE7 


CYCLES 0 


0 


0 


1 


1 


CYCLE7 


CYCLE60 


1 


0 


0 


0 


CYCLE 8 9 


CYCLE60 


1 


0 


0 


1 


CYCLE 8 9 


CYCLE60 


1 


0 


1 


0 


CYCLES 6 


CYCLE60 


1 


0 


1 


1 


CYCLES 6 


CYCLE60 


0 


1 


0 


0 


CYCLE10 


CYCLE60 


0 


1 


0 


1 


CYCLE10 


CYCLE60 


0 


1 


1 


0 


CYCLE7 


CYCLE60 


0 


1 


1 


1 


CYCLE7 


CYCLE60 


1 


1 


0 


0 


CYCLE89 


CYCLE60 


1 


1 


0 


1 


CYCLE89 


CYCLE60 


1 


1 


1 


0 


CYCLES 6 


CYCLES 0 


1 


1 


1 


1 


CYCLES 6 



Jeder Zielzyklus ist nunmehr 4-fach gespeichert, entsprechend alien binaren 
Kombinationsm6glichkeiten der don't care. 



Eine weitere optionale, aber sinnvolle und daher bevorzugte 
20 AusgestaltungsmOglichkeit des Sequenzers sieht einen zusatzlichen Teilbereich 

42 
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der Ausgangsdaten fUr eine Selektor- und/oder Vergleichsmaske fur die 
Zustandssignale vor. Bei der Verwendung als Selektor k5nnen z.B. durch die 
Ansteuerung von Multiplexern durch die Selektormaske eine Teilmenge von 
Zustandssignalen aus mehreren mSglichen ausgewahlt werden. Die zusatzliche 
optionale Vergleichsmaske kann als Vergleichsoperator fur einen Vergleicher 
dienen, der entsprechend ein Statusbit (gleich/nicht gleich) aus einer Menge 
von Statusbits generiert. Ebenfalls kann die Vergleichsmaske zur Deselektion 
von don't care Signalen dienen, z.B. uber eine normale Maskenoperation durch 
Verundung nach dem Stand der Technik (siehe PACT10) . 

Der Aufbau der Ausgabedaten ist dann wie folgt: 

Daten : 



S e 1 ek t or / Vergl e i chsmaske 



Adresse des nachsten 
Zyklus 



CONTROL- Signal e 



15 

Ein bevorzugter Sequenzer kann beispielsweise wie folgt aufgebaut sein: 
Der Adressbus einer RAM-PAE, die als Sequenzerspeicher verwendet wird, wird 
in mehrere Teiladressen beliebiger und insbesondere mOglicherweise auch 
unterschiedlicher Breite aufgeteilt, beispielsweise Bit 0..3 ftir eine erste 
20 Teiladresse (NEXT_CYCI,E) , Bit 4.. 7 ftir eine zweite Teiladresse (SEQ_IN) und 
Bit 8.. 12 fur eine dritte Teiladresse (CTRL_IN) . 

Der Datenausgang einer RAM-PAE wird in -mehrere Teildaten beliebiger und 
insbesondere mSglicherweise auch unterschiedlicher Breite aufgeteilt, 
beispielsweise Bit 0..3 fur die ersten Teildaten (CYLCE) , Bit 4.. 7 fur die 
25 zweiten Teildaten (SEQ_OOT) und Bit 8.. 12 fur die dritten Teildaten 
(CTRL__OUT) . 

Zur Aufteilung der Adressen und/oder Daten kann insbesondere das beschriebene 
SIMD PAE- und Bus-Konzept verwendet werden. Weiterhin kann die Auftrennung 
30 innerhalb der RAM-PAE erfolgen. 

Der RAM-PAE k5nnen datenverarbeitende PAEs zugeordnet werden, wie z. B. ALU- 
PAEs. 

35 Die Festlegung des nachsten Zyklus ses innerhalb eines Seguenzerdurchlauf s 
erfolgt durch die Rtickkopplung von NEXT_CYCLE auf CYCLE. 

In einer erwe iter ten Ausf tihrungs variant e kfinnen zusatzliche 
datenverarbeitende PAEs zur Berechnung von CYCLE in Abhangigkeit von 
40 NEXT_CYCLE innerhalb der Rtickkopplung vorgesehen sein. Diese PAEs kdnnen auf 
beliebige, insbesondere auch zusatzliche Signale, Daten oder Zustande 
anderer PAEs und/oder externer/ peripherer Baugruppen reagieren. Desweiteren 
k6nnen diese PAEs zusatzliche Signale oder Daten erzeugen. 



It. tmotvA»* 3002 
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Zur Realisierung eines erweiterten Seguenzers kannen weitere PAEs angekoppelt 
sein. a±e in einer moglichen Ausgestaltung auch in ihrer Funktion und/oder 
Vemetzung. vom Seguenzer beeinflufit werden konnen. Dazu kann der Seguenzer 
Daten in die Konf igurationsregister der entsprechenden PAEs ttbertragen. Bin 
Zugriff au f die Konf igurationsregister kann beispielsweise durch die in DE 
197 04 728.9 beschriebene Architektur erfolgen (vgl. DE 197 04 728.9 Fig 
4) . Die angekoppelten PAEs verarbeiten vorwiegend Daten beliebiger Art und 
besitzen AnschluS an weitere PAEs, insbesondere datenverarbeitende (ALU-PAEs) 
und/oder Speicher-PAEs (RAM- PAEs) und/oder periphere Anschltisse (IO-PAE S ) 
Diese PAEs kannen durch die durch SEQ_0UT dargestellten Control-Signale 
angesteuert werden und kennen bedarfsweise durch die an SEQ_IN geleiteten 
Zustandssignale Ablauf speicher des Seguenzers ansteuern. 

Weitere moglicherweise auch unabhSngige PAEs oder Einheiten. insbesondere 
auch externe/periphere Einheiten und/oder tlbergeordnete CTs konnen durch den 
Seguenzerspeicher entsprechend SEQ_IN/OOT angesteuert werden <CTRL_OUT) oder 
diesen ansteuern (CTRIi_In) . 

Zur korrekten taktgesteuerten Ablauf steuerung des Seguenzers sind in 
RUckkopplungspfade bevorzugt taktsynchronisierte Register eingebaut. 

Die RAM-PAE kann durch eine tlbergeordnete Konf igurationseinheit konfiguriert 
werden, insbesondere kennen die Seguenzerfunktionen durch den Inhalt der RAM- 
PAE konfiguriert und festgelegt werden. 

Es wurde als vorteilhaft erkannt und wird fur sich als patentfahig gehalten, 
dass mit einem Speicher ein einfacher Seguenzer ohne groSen zusatzlichen 
Hardwareaufwand realisiert wird. Dies ist besonders leicht dadurch moglich, 
dass zunachst der Inhalt einer Speicherzelle dahingehend ausgewertet wird, an 
welcher stelle als nachstes ein Lesezugriff erfolgen soil. Wenn dort wieder 
angegeben ist, wo als nachstes ein Zugriff erfolgt, ist ein automatenartiges 
Durchlaufen realisierbar. Zugleich wird aber gemaS der hier als vorteilhaft 
erkannten Ausgestaltung nicht einfach eine weitere Adresse fur den nachsten 
Zugriff ermittelt, sondern parallel dazu angegeben, was dabei zu tun ist; mit 
anderen Worten werden an der Speicheradresse auch Daten oder Befehle 
mitabgespeichert. Dies kann dadurch geschehen, dass ein Teil der an einer 
Stelle gespeicherten Information die Adresse fur den nachsten Zugriff angibt 
und ein weitere Teil einen Befehl oder Daten darstellt. Dies ist ohne 
weiteres mOglich, wenn die Breite der gespeicherten Daten aufgeteilt wird in 
einen Adressanteil und einen Daten/Bef ehlsanteil . Weiter ist es sogar 
moglich, nur einen Teil der im Speicher adressierbaren Speicherpiatze zu 
kodieren, etwa bei 12 bit Breite nur 8 bit zu verwenden. Dann kfinnen weitere 
Bits hmzugefUgt werden, hier vier, etwa durch Auswertung von Flags, 
Triggern, Zustanden, Oberlaufen etc. Dies hat den Vorteil, dass an die 

f. P ™ h 1 ?.f Stellen ' die aann exakt ansesprochen werden durch Vorgabe der hier 
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Sbxtxgen ausgelesenen Adresse und der hier 4bit auswertegenerierten 
information, unterschiedliche Anweisungen gesetzt werden kannen. Es sei 
darauf hxngewiesen. dass entweder alle Trigger und die erforderliche Reaktion 
hxerauf von vomeherein festlegbar sind oder dass altemativ auch zumindest 
Texle der Reaktionen auf einzelne oder alle Trigger wahrend der Ausftihrung 
exner Konfiguration variiert und/oder festgelegt werden kannen. Hierzu kann 
exne Ruckkopplung auf eine Triggermaskierung usw. vorgesehen sein. 

Dies erlaubt es, abhangig von den ausgewerteten Informationen bedingte 
Sprunge etc. zu generieren. Sind dabei von einer Reihe per se auswertbarer 
informationen nur wenige interessant, werden also aktuell im obigen Beispiel 
etwa nur 2 statt vier Bits benatigt, so kann die jeweils in einer 
entsprechenden Speicherstelle angegebene Information an jenen Speicherstellen 
auch vorhanden sein, die sich nur um nicht interessierende Bits in ihrer 
id Adresse unterscheiden . 

Figur 15 zeigt ein Ausgestaltungsbeispiel eines erf indungsgemaSen Sequenzers 
basxerend auf einer RAM-PAE. Bin Teil (1505) des Datenausgangs (1502) eines 
Spexchers (1501, ist Uber ein taktgesteuertes Register (1503) auf den 
Adresseingang (1504, des Speiohers zurUckgekoppelt . Der Adresseingang (1504) 
entspricht somit CYCLE und 1505 einem Teil, bevorzugt dem Haherwertigen, von 
NEXT_CYCLE . 
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Optxonal kann ein Teil (1508, des Datenausgangs (1502, an eine Selektor- 
Maskeneinheit (1509, 1510) gefilhrt werden, in welcher die vom Bussystem 0105 
als oaten und/oder Trigger eingehenden SEQ_IN (1511, bzw. CTRL_IN (1512, 
Daten verarbeitet werden. 

CTRL_1N und SEQ_IN und/oder deren in der Selektor-Maskeneinheit verarbeitete 
Werte werden zu 1505 dazugemischt (1513), bevorzugt derart> dass 1505 den 
haherwertigen Adressteil und CTRL_I N /SEQ_IN den niederwertigen bilden. 

Der verbleibende Teil des Datenausgangs (1502) kann in einen SEQ_OXJT- (1506) 
und CTRL_OOT (1507) Teil aufgetrennt werden und Uber die Ausgabebaugruppen 
0803a,b als Daten und/oder Trigger auf das Bussystem 0105 gefilhrt. 

Verschiedene Konf igurationsregistermodelle zur Festlegung der Konfiguration 
von jewexls lokal zugeordneten PAEs sind bekannt. In PACT02 ist ein 
seguentiell abarbeitbares Modell beschrieben, in PACT04 ist ein FIFO-Modell 
beschrieben, das ebenfalls seguentiell abgearbeitet und uberlappend 
konfxguriert werden kann, in PACT08 ist ein selektives Modell beschrieben, 
bex welchem abhangig von der Datenverarbeitung bestimmte 

Konfigurationsregister und damit die in ihnen gespeicherte Funktion und/oder 
Vernetzung ausgewHhlt werden. In DE 100 28 397.7 ist weiterhxn ein FIFO- 
Modell beschrieben, das sich besonders fUr die Vorabkonf iguration und 
Uberlappende Konfiguration eignet. 



19. Itptntar 3003 



45 



Akte: PACT3lPCToe 



Als besonders leistungsfahig und Kos ten /Performance effizient wurde eine 
Mischung aus diesen Modellen erkannt. 

Das FIFO-Model 1 nach DE 100 28 397.7 eignet sich besonders, urn eine 
beliebige Anzahl von Konf igurationsregistern von PAEs vorzuladen, da die 
Funktion des verwendeten FIFOs eine variable Konf igura t ions lange effizient 
ermSglicht. Hierzu wird jeder PAE ein lokaler FIFO-Speicher zugeordnet, der 
die Konf igurationen seiner zugeordneten PAE verwaltet und puffert. 

Durch eine Erweiterung, wie z. B. die nachfolgend beschriebene, des FIFO- 
Modelles kann der Anfang und das Ende einer bestimmten Konf iguration und der 
dazugehSrenden einzelnen Konf igura tions ein trage festgestellt werden. Nunmehr 
kdnnen mehrere Konf igurationen zugleich in dem FIFO-Modell abgelegt werden. 

Als besonders ge eignet zur Kennzeichnung des Anfangs oder Endes von 
Konf igurationen haben sich die zwei nachfolgend beschriebenen Verfahren 
herausgestellt : 

a) Kennzeichnung durch zusatzliche Bits (CycleBits) in jeder Speicherzelle ; 
Jedem Konf igurat ions ein trag werden zusatzliche Bits zugeordnet, die den 
Beginn und/oder das Ende einer Konf iguration kennzeichnen. Beispielsweise 
kann ein Eintrag im FIFO wie folgt aussehen:- 



Bit 0. .15 


Bit 16 


Bit 17 


Konf igurationswort 


0=don' t 
care 

1= Beginn 


0=don't 

care 

l=Ende 


Da bevorzugt nach dem nachfolgend beschriebenen Verfahren direkt auf den 
Beginn von Konf igurationen gezeigt werden kann, wird bevorzugt auf die 
Anzeige des Beginns verzichtet: 


Bit 0. .15' 


Bit 16 




Konf igurationswort 


0=don' t 

care 

l=Ende 



b) Besonders effizient kann die Kennzeichnung durch besondere 
Konfigurationsworte sein, die als Befehle dekodiert werden: 
Bestimmte Bitkombinationen innerhalb des Konf igura tionswortes werden als 
Befehle dekodiert und erkannt: 

Beispielsweise kSnnten die folgenden Befehle implementiert sein: 
BEGIN : Beginn einer Konf iguration 
END : Ende einer Konf iguration 

Dieses Verfahren ist erheblich flexibler und leistungsf ahiger als die 
Kennzeichnung durch CycleBits. 
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Zur einfachen Unterscheidung von Befehlen und Konf igurationen kann ahnlich 
den CycleBits ein Bit vorgesehen sein, das durch seinen Wert die Semantik der 
Konf igurationswortes bestimmt, beispielsweise wie folgt: 



Bit 0. .15 


Bit 16 


Daten 


O=lnterpretation der Daten als 
Konf igur at ions wort 
l=Interpretation der Daten als 
Befehl 



5 Eine Konf iguration wird je Aufruf von ihrem Anfang bis zu ihrem Ende in die 
Konf igurat ions register einer PAE tibertragen. 

Durch eine optionale zusatzliche tJbersetzungs- und Zuweisungsvorrichtung 
kttnnen Zustande (z.B. Zustande der eigenen ALU und/oder ein oder mehrere 
10 Trigger (vgl . DE 197 04 728.9 ) beispielsweise anderer PAEs) auf bestimmte 
Konf igurationen innerhalb des FIFO-Modells tibersetzt werden. Beispielsweise 
kann ein ein tref fender Rekonf igurations trigger auf eine bestimmte 
Konf iguration innerhalb des FIFO-Modells zeigen, die durch das Auf treten des 
Rekonf igurat ions trigger dann konfiguriert wird. 

15 

Als tJbersetzungs- und Zuweisungsvorrichtung kSnnen beispielsweise 
algebraische Berechnungen und/oder logische Verknupf ungen und/oder bevorzugt 
tibersetzungsspeicher (Lookup-Tabellen) zum Einsatz kommen. 

20 Wenn verschiedene Konf igurationen in einer oder fur eine oder eine Reihe von 
PAEs abgelegt werden, so bietet es sich an, die Adressen, an denen die 
jeweilige Information abgelegt ist, auf einfache Weise dadurch zu verwalten, 
dass die Langen der jeweiligen abgespeicherten Konf igurationen aufaddiert 
werden. Dies ist dann wichtig, wenn die Konf igurationen unterschiedliche 

25 Langen haben, etwa weil bei bestimmten Konf igurationen Busse und/oder 

Register, wie Vorwarts- und Rtickwartsregister konfiguriert werden mtlssen und 
bei andere nur neue Funktionen der ALU einer PAE einzustellen sind, oder weil 
gleichzeitig Konf igurations information fur zellexterne Einheiten mitverwaltet 
wird . 

30 

Es ist damit also mSglich, einen Quasi-Fif ocharakter zu implementieren. Dann 
soli ten Mittel zum Aufaddieren, insbesondere sukzessivem Aufaddieren von 
Konf igurations langen, sowie dafiir, bei tiberf lussigwerden bestimmter 
Konf igurationen, etwa aufgrund von Abarbeitung etc., die betreffenden 
35 Bereiche freizugeben. Das Aufaddieren ist etwa problemfrei mit Addiererketten 
m5glich. 

Diese Anordnung kann verwendet werden, urn in einer Zelle Konf igurationen zu 
verwalten bzw. wiederum einen Sequenzer zu implementieren. Wiederum kann so 
40 auf die Konf igurationen reagiert werden, dass sich SprOnge etc realisieren 

lassen. Es sei darauf hingewiesen, dass oben bereits erwahnt wurde, dass zur 
Realisierung von Sequenzern zwischen ALU- PAEs und/oder anderen 
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datenverarbeitenden Zellen mit jeweils gegebenenf alls erweiterter 
Funktionalitat und Speicher zellen Steuer (Command-) Lei tungen vorgesehen werden 
kdnnen. Es sei- erwahnt, dass derartige Lei tungen mit zugeordeten Steuerungen 
auch innerhalb einer einzelnen und fur sich autark seqeunzerf ahigen PAE 
5 vorgesehen sein kdnnen. 

Eine besonders bevorzugte Variance ist in Figur 14- dargesteilt und arbeitet 
wie folgt: 

10 Eine Kette von Addierern wird derart miteinander verbunden, dass das Ergebnis 
(SUMME) eines vorherigen Addierers (p) an einen nachf olgenden Addierer (p+1) 
als Operand weitergeleitet wird. Die Weiterleitung kann derart unterbrochen 
werden, dass anstatt des Ergebnisses eine 0 (Null) weitergeleitet wird. 
Als zweiter Operand ist jedem Addierer jeweils ein eigenes Registers 

15 zugeordnet, dessen Wert jeweils zur SUMME der vorherigen Stufen addiert wird. 
Jede der Stufen reprasentiert eine Konf iguration im Konf igurations-FIFO; in 
dem Register der jeweiligen Stufe ist die relative Startposition einer 
Konf iguration gespeichert. Die absolute Startposition lafit sich nun 
berechnen, indem samtliche relative Startpositionen der sich unterhalb im 

20 FIFO befindenden Konf igurationen auf addiert werden. Dies geschieht durch die 
Addiererketten, wie auch aus der Fig. Ersichtlich ist. 

Mit anderen Worten ist die relative Position als unterste Konf iguration im 
FIFO diejenige, deren Eintrag am Nachsten zum Ergebnis ausgang der 
25 Addiererkette gespeichert ist... Sodann folgen alle we iter en relativen 
Positionen gemafi ihrer Anordnung im FIFO. 

Die Kette wird an der S telle durch einschleusen einer Null ans telle der SUMME 
unterbrochen, bei welcher die relative Position der selektierten 
30 Konf iguration erreicht ist. 

Das Ergebnis ist nunmehr der Offset zwischen dem Lesepointer des FIFOs , der 
auf die unterste Konf iguration zeigt, und der Startposition der selektierten 
Konf iguration . 

Somit ist die Sprungadresse zur selektierten Konf iguration einfach durch 
35 Addition von Zeiger und Offset berechenbar. 

Die Auswahl der selektierten Konf iguration kann durch unterschiedliche 
Verfahren in der Obersetzungs- und Zuweisungseinrichtung erfolgen. 
(a) Die eingehenden Trigger kdnnen priorisiert und dekodiert werden. 
40 (b) Die eingehenden Trigger werden uber eine Lookup-Tabelle ubersetzt und 
danach mdglicherweise priorisiert und dekodiert. 

(c) Es der Menge aller Trigger werden einige ausgewahlt, z.B. Uber 
Multiplexer, die sodann entsprechend (a,b) weiterverarbeitet werden. 

45 Es soil besonders darauf hingewiesen werden, dass ein Trigger auch ein Vektor 
(TRIG-V) sein kann, wie in PACT 08 beschrieben. Der Vektor selbst kann zur 
weiteren Dekodierung verwendet werden, d.h. der Vektor selektiert die 
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Konfiguration. Dies ist insbesondere dann wichtig, wenn eine Wave- 
Rekonfiguration nach PACT08, PACT13 , PACT 17 durchgefuhrt werden soil, bei ' 
welcher bevorzugt ein mit den Daten ubertragener Trigger-Vektor die nachste 
Konfiguration selektiert. 

Nach oder wahrend der Konfiguration kannen Konf igurationen aus dem FIFO 
entfemt werden. Bevorzugt wird dabei die Referenzierung innerhalb der 
Ubersetzungs- und Zuweisungsvorrichtung entsprechend angepasst. 

Weiterhin kann das FIFO-Modell um das Seguenzer-Verfahren nach DE 196 54 
846.2-53 (bzw, wie bei den anderen Schutzrechten, ohne separat erwahnt zu 
SSln ' deren P aralle ^> Oder bevorzugt das vorstehend beschriebene erweitert 
werden. Dazu werden beispielsweise Sprunge (GOTO) , sowie zustandsabhangige 
und bedingte SprOnge (WA1T-GOTO, IF-GOTO) eingeftthrt. Sprtoge konnen durch 
besondere CycleBits reprasentiert werden, oder bevorzugt als Befehle 
lmplementiert sein. 

Weiterhin kann ein Synchronisationsanzeigeverfahren verwendet werden, das 
anzexgt, wann eine bestimmte Konfiguration bzw. ein bestimmter Zyklus des 
Seguenzers beendet ist. Hit anderen Worten kann jeder Zyklus aus mehreren 
*° nf ^ ati ° n ^in<^en bestehen. Zur Kennzeichnung kann beispielsweise nach 

196 54 846 - 2 "53 ein run/stop-Flag verwendet werden, wobei 'run' 
zusammengeherende Konf igurationseintrage eines Zyklus kennzeichnet und -stop- 
den ersten Eintrag eines nachf olgenden Zyklus; alternativ ist ist die 
Verwendung der vorstehend beschriebenen CycleBits maglich, die zwar eine 
etwas andere Semantik aufweisen, sich aber ansonst gleich verbal ten. 

Alternativ oder zusatzlich zu diesen Verfahren k6nnen auch die ebenfalls aus 
den frUheren Anmeldungen des Anmelders bekannten Befehle WAIT und BEGIN oder 
bevorzugt die vorstehend beschriebenen Befehle BEGIN und END verwendet 
werden . 

Durch -stop- oder WAIT oder END wird das Ende eines Zyklus. gekennzeichnet, d. 
h. erne Konfiguration ist komplett, kann ausgeftihrt und abgearbeitet werden. 
Nach Beendigung der Datenverarbeitung dieser Konfiguration wird der nachste 
Zyklus ausgeftihrt . 

Die Beendigung kann entsprechend sequentieller Prozessoren durch einen Takt 
(instruktionsseguenzing) definiert sein, und/oder entsprechend des 
Datenverarbeitungsprinzips der PACT-Prozessoren (P 44 16 881.0-53 , DE 196 54 
846.2-53 , Konfigurationsseguenzing) durch ein Statussignal (z. B. einen 
Trigger) definiert sein. 

Mit anderen Worten wird z.B. kann durch das Eintreffen eines Triggers -stop- 
tlbersprungen werden und die nachfolgenden Konf igurationen konfiguriert 
werden. Alternativ oder zusatzlich kann der Befehl WAIT eingesetzt werden, 
der auf das Eintreffen eines Triggers. 
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Optional kann ein FIFO nicht nur die lokal zugeordnete PAE ansteuern, sondern 
auch weitere, insbesondere umliegende oder zur selben Konf iguration gehSrende 
PAEs. 

Optional kann der FIFO auch als eine dedizierte Einheit nach DE 196 54 846.2- 
53 ausgestaltet sein. 

Ausf tihrungsbeispiele : 

A) Ein eintref fender Trigger wird iiber eine tJbersetzungs- und 

Zuweisungsvorrichtung auf eine im FIFO liegende Konf iguration (Kl) tibersetzt. 
Die Konf iguration (Kl) wird daraufhin in die PAE konfiguriert. Als Ende- 
Kennung kann beispielsweise ein WAIT-Befehl, ein END-Befehl oder das 
run/ st op -Flag dienen. 

Ein nachfolgend eintref fender Trigger wird uber eine ttbers etzungs- und 
Zuweisungsvorrichtung auf eine andere im FIFO liegende Konf iguration (K2) 
tibersetzt. Diese Konf iguration (K2) wird daraufhin in die PAE konfiguriert. 
Kl und/oder K2 konnen nach erfolgter Konf iguration in die PAE aus dem FIFO 
gelSscht werden. 

B) Ein eintreffender Trigger wird tiber eine tJbersetzungs- und 

Zuweisungsvorrichtung auf eine im FIFO liegende Konf iguration (K3) tibersetzt, 
die aus mehreren Zyklen (Cyl, Cy2, Cy3a, Cy3b, Cy4) besteht. Der erste Zyklus 
(Cyl) wird daraufhin in die PAE konf iguriert und ausgeftihrt. Als Ende-Kennung 
kann beispielsweise ein WAIT-Befehl oder das run/s top-Flag dienen. 
Ein nachfolgend eintreffender Trigger, der das Ausftihrungsende des Zyklus 
anzeigt, bewirkt die Konf iguration und das Ausftihren von Cy2 . Cy2 endet mit 
zwei WAIT-GOTO-Befehlen (WAIT-GOTO (Trgl, Cy3a) ; WAIT-GOTO (Trg2, Cy3b) ) 
(vgl. PACT04) , dies bewirkt, dass auf zwei unterschiedliche Trigger, die das 
Ausftihrungsende des Zyklus anzeigen, Trgl und Trg2 reagiert wird. Trifft Trgl 
ein, wird im nachsten Zyklus Cy3a konfiguriert und ausgefiihrt bzw. bei Trg2 
entsprechend Cy3b. 

Cy3a und Cy3b enden mit einem WAIT-GOTO (Trg, Cy4) . Bei eintref fen eines 
Trigger, der das Ausftihrungsende des Zyklus anzeigt, wird nach Cy4 gesprungen 
und die Konf iguration entsprechend konfiguriert und ausgeftihrt. 

Cy4 endet mit einem WAIT-GOTO (Trg, Cyl), wodurch bei eintref fen des Trigger, 
der das Ausftihrungsende des Zyklus anzeigt, der erneute seguentielle 
Durchlauf einer Schleife beginnen kann. Insoweit kann durch den Sprung auf 
Cyl ein Ringspeicher nach DE 196 54 846.2-53 zum Ausftihren von Schleifen 
gebildet werden, wobei solch ein Ringspeicher vorteilhaft, aber nicht 
zwingend ist. 

Durch Eintref fen eines Triggers (Trg-x) kann die Schleife terminiert werden. 
Existiert ein Eintrag far Trg-x in der tibersetzungs- und 

Zuweisungsvorrichtung kann die Schleife jederzeit abgebrochen und die durch 
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Trg-x in der ttbersetzungs- und Zuweisungsvorrichtung ref erenzierte 
Konfiguration (KX) ausgeftthrt werden. 

Existiert kein Eintrag, kann durch das explizite Verwenden von WAIT-GOTO 
(Trg-x, KX) Befehlen, z.B. zusammen mit WAIT-GOTO (Trg, Cyl) in Cy4 die 
5 Schleife zu bestiramte vorgegebenen Ausftthrungszeitpunkten terminiert werden. 

Figur 13 zeigt beispielhaft einen Aufbau eines Konf iguratiorisbusses zur 
Konfiguration von PAEs (1001) durch eine Konf igurationseinheit (0106) . Die 
Konf igurationseinheit sendet Konf igurationsdaten tiber ein Bussystem 1301 und 

10 ggf . uber mehrere Regis terstuf en (1303, 1304) zur Verbesserung des 

Frequenz vernal tens und uber den Konf igurationsdatenbus (0404) an die PAEs 
1001. Jede PAE dekodiert die angelegten Adressen und reagiert, sofern sie 
selektiert wurde, auf die Datenttbertragung des Busses. PAEs k6nnen ihrerseits 
Daten tlber 0404 uber die Register-Multiplexer-Stuf en 1304 auf das Bussystem 

15 aufschalten und die Konf igurationseinheit Oder optional andere PAEs senden. 
Dies geschieht jeweils durch tJbertragung der Adresse der Empf angseinheit . 
Die Rucktibertragung der Daten an die Konf igurationseinheit erfolgt bevorzugt 
. ebenfalls durch Regis terstuf en hindurch (1305), bis zum Dateneingangsbus der 
Konf igurationseinheit (1302) . 

20 Die Funktionsweise des Konf igurationsbusses ist ebenfalls in DE 101 42 904.5 
und DE 100 28 397.7 beschrieben, die zu Of f enbarungszwecken vollumf anglich 
eingegliedert sind. 

Figur 14 zeigt den Aufbau eines erf indungsgemafien FIFO-Modells zur Steuerung 
25 der Rekonf iguration; hierbei wird darauf hingewiesen, dass sich insbesondere 
durch die Befahigung zur Durchfuhrung von Sprttngen das hier prasentierte 
Fifo-Modell von reinen Fifos aus dem Stand der Technik unterscheiden kann. Es 
wurde dennoch die per se im Stand der Technik belegte Bezeichnung verwendet, 
weil diese vom typischen, sprungfreien Betrieb ein besonders anschauliches 
30 Bild assoziieren laSt. Diese Einheit ist optional zu alien, insbesondere den 
in dieser Anmeldungen beschriebenen, rekonf iguierbar en Zellen (PAEs) und in 
Figur 4 als Einheit 0406 dargestellt. 

Ein Speicher 1401 enthalt die Konf igurationsdaten filr die zugeordnete PAE. 
1402 ist der Konf igurationsdatenausgang zu den Konf igurationsregistern der 

35 PAE (0405). tiber 1403, d.h. den Bus 0404, schreibt die Konf igurationseinheit 
Konfigurationen in den Speicher, die jeweilige Adresse wird durch den 
Schreibzeiger (1407) generiert, der pro Schreibvorgang urn den Wert 1 
verandert wird, je nach Arbeitsweise des FIFOs inkrementell oder 
dekrementell. Ein Startadress-Pointer (1404) zeigt auf den ersten 

40 Konfigurationsdateneintrag im Speicher, wahrend ein weiterer Pointer (1405) 
auf den zu lesenden, bzw. an die PAE zu tiber tragenden, 

Konfigurationsdateneintrag zeigt. 1405 wird mit jeder DatenUbertragung aus 
dem Speicher an die PAE urn den Wert 1 verandert, je nach Arbeitsweise des 
FIFOs inkrementell oder dekrementell. Die DatenUbertragung findet so lange 
45 statt, bis das Ende der Konfiguration von einer 

Konfigurationsendeerkennungseinheit (1409) erkannt wird, beispielsweise 
anhand eines CycleBits oder Befehls (WAIT, END) . 
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Der realisierte FIFO entspricht nicht den normalen FIFOs nach dem Stand der 
Technik, die nur den Pointer 1405 aufweisen. Die Modifikation ermGglicht das 
Lesen beliebiger Konf igurationsdaten aus dem Speicher, wahrend durch den 
Pointer 1404 verhindert wird, dass evtl. noch benStigte Konf igurationsdaten 
5 uberschrieben werden. Dies geschieht durch das Erzeugen eines Full-Flags 
durch den Vergleich (1406) des Star tadress- Pointers 1404 rait dem 
Schreibzeiger (1407) . Wenn der Speicher voll ist, werden Schreibversuche der 
Konf igur at ions einheit zuruckgewiesen, dies kann bevorzugt durch das aus 
PACT10 bekannte ACK/REJ-Protokoll erfolgen. Der Vergleicher 1406 gibt dazu an 
10 seinem Aus gang 1416 ein entsprechendes Reject- Signal an die 
Konf igurationseinheit aus bzw. gibt kein Ack aus. 

Ein beispielhafter Speicherinhalt von 1401 ist mat 1408 gezeigt. Der Speicher 
enthalt 5 Konf igurationen (C0..C4). 1404 zeigt als Startpointer auf die erste 
15 Konf iguration CO. In diesem Beispiel zeigt 1405 auf den Beginn von 

Konf iguration C3. Die Zeigerposition berechnet sich aus dem Wert von 1404 
plus der Lange der Konf iguration CO plus der Lange der Konf iguration CI plus 
der Lange der Konf iguration C2. 

20 Eingehende Trigger (1431) werden Uber eine in Figur 14a dargestellte 

ubersetzungs- und Zuweisungseinrichtung (1432) auf Selekt-Signale (SC0..n, 
1433) Obersetzt, die die Adressierung der Konf igurationsdaten im Speicher 
steuern. Diese libers etzungs- und Zuweisungseinrichtung kann fest vorgegeben 
ihre Zuweisung vornehmen, ist aber bevorzugt wahrend der Abarbeitung einer 

25 Konf iguration veranderlich, wozu geeignete Ruckkopplungen, Signal lei tungen 
etc. vorzusehen sind. Besonders wenn die tJbersetzungs- und 
Zuweisungseinrichtung veranderlich ist, wird es bevorzugt, auch und/oder 
zusatzlich die der Zuordnung dienende Einheit 1434 wahrend der 
Datenverarbeitung veranderlich zu gestalten. Auch hierzu sind entsprechende 

30 Schaltungsanordnungen vorzusehen, wobei die Veranderung der Zuordnung 
insbesondere programmgesteuert ablaufen kann. Eine entsprechende, 
insbesondere programmgesteuerte Veranderung ist auch fur die Einheit 1414, 
d.h. das Adressberechnungsadditionskettenmittel mSglich. Die diese 
Aktualisierung und/oder neue Verbal t ens wei sen auslosenden Befehle werden 

35 bevorzugt in der Speicher einheit 1401 hierfttr abgelegt. 

Je ein Register (1411), ein Addierer (1412) und ein Nullgenerator (1413), 
hier beispielhaf t realisiert durch eine bitweise Und-Funktion, bilden ein 
Glied einer Kette (1414) zur Adressberechnung . Je ein Glied verwaltet den 
40 Offset einer Konf iguration. Die Aneinanderreihung der Glieder entspricht der 
Aneinanderreihung der Konf igurationen im Speicher 1401. Mit anderen Worten 
wird entsprechend des Beispiels 1408 das erste Glied die Lange der 
Konf iguration CO aufweisen, also den Offset der auf 1404 addiert werden muss, 
urn auf die Konf iguration CI zu zeigen. Das zweite Glied weist die Lange der 
45 konf iguration CI auf, also den Offset der auf den Offset von CO und auf 1404 
addiert werden muss, urn auf die Konf iguration C2 zu zeigen. Das dritte Glied 
weist die Lange der Konf iguration C2 auf, also den Offset der auf den Offset 
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von CO und auf den Offset von CI und auf 1404 addiert werden muss, urn auf die 
Konfiguration C3 zu zeigen. Und so weiter. 

Es wird anhand der Ausftihrung ersichtlich, dass eine Kette von Additionen 
entsteht, deren Gliederanzahl der Position der Konfiguration im Speicher 
entspricht. Dies wird durch die Kette 1414 wie folgt realisiert: 
ttber den Addierer wir jeweils der im Register gespeicherte Wert, also die 
Lange der jeweiligen Konfiguration, zu dem Ergebnis des vorherigen Gliedes 
dazuaddiert, Der Wert am Eingang der bitweisen Ond-Funktion wird mit alien 
Ergebnisbits des Addierers verundet. 1st der Eingang also gleich 0, liefert 
die Und-Funktion eine Binare 0 am Ausgang, um die Addiererkette bei der 
auszuwahlenden Konfiguration abzubrechen, ansonsten den Wert des 
Addierersaus gangs . 

Mit anderen Worten ist in die Register (1411) die Gr©Se der Konf igurationen 
in ihrer Reihenfolge im Speicher (1401) eingetragen. Die Selektsignale sind 
derart auf die Null -Genera tor en gefuhrt, dass die Konf igurations-GrSSen bis 
zur Startadresse der durch die Trigger (1431) ref erenzierten Konfiguration 
auf addiert werden. 

Somit addiert die Kette alle Langen von Konf igurationen, die vor der zu 
ladenden Konfiguration im Speicher 1401 liegen. Damit bildet sich ein Offset, 
der durch Addition (1415) mit der Startadresse (1404) auf die zu ladende 
Konfiguration zeigt. 

Die beschriebene Schaltung ist besonders leistungsf ahig, da sie die 
Berechnung des Offsets und den Sprung innerhalb eines Taktes ermBglicht. 

In einer zweiten optionalen Kette (1421) kdnnen in Registern (1422) Befehle 
an die Konf igurationseinheit und/oder die PAE und/oder den 
Konfigurationsstack gespeichert werden. Eine Nullfunktion (1423), hier 
ebenfalls beispielhaft entsprechend der Nullfunktion 1413 realisiert, liefert 
eine Binare 0 in an ihrem Ausgang, sofern das Selekt-Signal nicht aktiv ist, 
d.h. die Konfiguration nicht ausgewahlt wurde, ansonsten den Regis terinhalt 
(1422),. also den Befehl. flber eine Oder-Kette (1424) werden alle Null- 
Funk tionsausgange miteinander verodert, sodass der Befehl im Register 1422 
der aktuell selektierten Konfiguration am Ausgang (1425) der Kette anliegt. 

Der Befehl kann nunmehr zum LOschen von Eintragen im Speicher (1401) dienen, 
d.h einer der mSglichen Befehle kann sein, dass bestimmte gespeicherte 
Konf igurationen geldscht werden sollen bzw. zum tiberschreiben freigegeben. 
Dies kann z.B. durch den Befehl FLUSH erfolgen, der den Startzeiger (1404) 
mit dem Lesezeiger 1405 ladt und somit alle vor dieser Adresse liegenden 
Daten zum uberschreiben freigibt. Dies ist insofern bevorzugt, als die so zu 
uberschreibenden Konf igurationen im fifoartigen Speicher i.d.R. alter sind 
und daher typisch uberschrieben werden kdnnen, wahrend die jttngeren 
Konfigurationen, die of tmals noch bendtigt werden, weiter oben im quasi 
fifoartigen Speicher liegen werden. Ein weiterer bevorzugt implementierter 
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Befehl ist, dass neue Konf igurationen geladen werden sollen; dies ist dann 
wichtig, wenn das Erfordernis, eine bestimmte neue Konf iguration zu 
benotigen, mit einer zumindest nicht geringen Wahrscheinlichkeit vorhergesagt 
werden kann. Dieser Befehl kann an eine zentrale 
5 Konfigurationsverwaltungseinheit Oder dergl. abgegeben werden; die 
Direktladung ist gleichfalls maglich, etwa bei Zuordnung von i/O- 
Mc-glichkeiten. Auch ist es bevorzugt, wenn sowohl der 
Konf igurationsanforderungsbefehl als auch der Flush- bzw. 

Altkonfigurationspreisgabebefehl simultan ausfuhrbar und/oder speicherbar 
10 sind. Es sei erwahnt, dass derartige Befehle wie Flush, Laden oder 

Flush/Laden auch in anderen Speicherbereichen bzw. -einheiten wie etwa 1401 
ablegbar sind und daftir nicht zwingend eine dedizierte Einheit wie 1421 
vorzusehen ist. Diese Verwendung einer per se bereits vorhandenen Einheit 
kann hardwaremafiig bevorzugt sein. 

15 

Weiterhin kann der Befehl ttber das Bussystem nach Figur 13 an die 
Konf igurationseinheit gesendet werden (1426) . Beispielsweise kann der Befehl 
dort den Start einer bestimmten Konf iguration auslosen und/oder das Vorladen 
einer Konf iguration bewirken. 

20 

FLUSH, also das Loschen von Konf igurationen ist einer der wesentlichen 
bevorzugten Befehle der Einheit. Einerseits ist der Befehl sehr vorteilhaft 
fur die Ausftlhrung, andererseits weist er das Problem auf , dass sich bei 
dessen Ausfiihrung samtliche Adressen und Referenzen verandern. 

25 Der FIFO wird "gef lushed", indem.der StartPointer (1404) auf eine neue 

Startadresse gesetzt wird. Diese wird wie in Fig. 14 dargestellt bevorzugt 
auf den Beginn einer gespeicherten Konf iguration gesetzt, wobei der Beginn 
durch die vorab beschriebene Berechnung mittels des Offsets bestimmt wird. 
Altemativ oder zusatzlich kann der Zeiger auch auf einen bestimmten anderen 

30 Wert z.B. eine an den FLUSH - Be f ehl e gekoppelte Konstante gesetzt werden. 

Weiterhin mttssen die beiden Ketten 1414 und 1421 "geflushed" werden, dainit 
die Adressberechnung der geanderten Positionen der Konf igurationen im 
Speicher 1401 entspricht. Dies geschieht jeweils durch (in Figur 14 nicht 
eingezeichnete) Multiplexer (1451), durch die die Registerdaten derart 

35 vorwartsttbertragen werden, dass die nunmehr leeren ( "gef lushten" ) Glieder der 
Kette mit den Daten der nachf olgenden Glieder tiberschrieben werden, und zwar 
derart, dass a) die Reihenfolge der Daten in der Kette unverandert bleibt und 
b) das erste Glied der Kette mit neuen Daten belegt ist und c) alle weiteren 
Daten in ihrer Reihenfolge linear und ohne Lttcke in die Glieder nachfolgend 

40 dem Ersten geschrieben sind, vgl. hierzu Fig. 14a Es sei darauf hingewiesen, 
dass tiber die Multiplexer 1451 auch Daten betreffend die Konf igurationsgrOJSe 
von aufcen an die entsprechenden Stellen (Size of Config l..n) geschrieben 
werden kohnen. Es ist dabei abzuschatzen, aber aus Grtinden der 
Zeichnungsubersichtlichkeit nicht dargestellt, dass jede S telle einzeln 

45 ansprechbar bzw. adressierbar ist. Verwiesen wird insoweit auf die in 1434 
dargestellte Einheit 1435, die diese Stelle jeweils bestimmt. 
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Durch die Verschiebung innerhalb der Ketten sind nunmehr die Selekt-Signale 
(SCO..n) an die neue Lage der Daten in den Ketten anzupassen, damit wieder 
eine korrekte Zuordnung der Selekt-Signale zu der Of f setberechnung entsteht. 
Grundsatzlich stehen dazu mehrere Methoden zur Verfttgung. Beispielsweise 
5 konnen 

a) Signale nach 1432 in 1434 binar kodiert (entsprechend der Funktion eines 
74LS148) werden, ein Offset, der der durch Flush entstandenen Verschiebung 
entspricht, wird subtrahiert und der entstandene Wert wird wieder dekodiert 
(entsprechend der Funktion eines 74LS139) um die Selekt-Signale 1433 zu 

10 generieren; 

b) Signale nach 1432 in 1434 mittels eirier Lookup -Tabelle auf die Selekt- 
Signale 1433 ttbersetzt werden. Dazu ist die Lookup-Tabelle der durch Flush 
veranderten Positionslage in den Ketten anzupassen. 

15 Ein besonders bevorzugtes Verfahren fur die ubersetzung der Signale soil 
detailliert beschrieben werden und entspricht der in 1434 eingezeichneten 
Vorrichtung: 

Ein erstes Schieberegister (1435) enthalt als einen Ein-Bit-Wert die Position 
des aktuell ersten freien, also unbenutzten, Gliedes in den Ketten 1414, 

20 1421. Dies geschieht f olgendermafcen : Nach einem Reset wird das 

niederwertigste Bit im Schieberegister auf 1 gesetzt { darges tell t .durch einen 
gefttllten Kreis) . Das niederwertigste Bit (Bit 0) wird auf das unterste Glied 
in den Ketten ref erenziert . Mit jedem Schreibzugrif f auf die Ketten, also mit 
jedem neuen speichern (FILL) einer Konf iguration nach 1401 schiebt das 

25 Schieberegister das gesetzte Bit (PBIT) um eine Position in Richtung des 

hochstwertigen Bits und referenziert damit auf das jeweils nachfolgende Glied 
in den Ketten. Das hochstwertige Bit referenziert somit auf das hochste Glied 
in den Ketten, also ist das Schieberegister so breit wie Glieder in den 
Ketten vorhanden sind. Mit jedem FLUSH schiebt das Schieberegister das Bit 

30 (PBIT) um genau so viele Positionen wie Glieder in den Ketten geldscht wurden 
in Richtung des niederwertigen Bits. 

Die ttbersetzungs- und Zuweisungseinrichtung (1432) ubersetzt bei der PAE vom 
Bussystem (0105a, Fig. 4) eingehende Trigger derart, dass je Trigger ein 

35 genau ein Signal des ausgehenden Busses (1437) gesetzt ist. Jedem Signal ist 
ein Schieberegister (1436) derselben Grofce wie 1435 zugeordnet. Es sind also 
eine Vielzahl von Schiebergi stern 1436 (vorliegend dargestellt 1436a. .. 1436c) 
vorhanden, wobei deren Anzahl der Anzahl der maximal zulassigen 
unterschiedlichen Trigger signale entspricht und deren Lange d.h. Bitbreite 

40 der Anzahl der maximal zulassigen Konf igurationen entspricht, also der Anzahl 
der Kettenglieder entspricht. Beim neuen Speichern einer Konf iguration (FILL) 
wird der Inhalt von 1435 vor dem Verschieben von PBIT in das Scheiberegister 
(1436) geschrieben, auf das der, der Konf iguration zugeordnete, Trigger 
zeigt; dargestellt durch einen Kreis. 

45 Bei einem Auf treten des Triggers auf dem Bus liefert das entsprechende 

tibersetzte Signal (1437) einen 1-Wert, wahrend alle anderen Signale einen 0- 
Wert liefern. Die Signale 1437 werden jeweils an Nullgeneratoren (1438), 

M. Stpconter 2001 « 



Akte: PACT31PCToe «. 



aufgebaut aus einer bitweisen Und-Funktion gefuhrt. Alle Nullgeneratoren 
deren Eingangssignal von 1437 einen O-Wert aufweist, liefern einen Nullvektor 
am Ausgang.. Der Nul 1 generator , dessen Eingangssignal von 1437 einen 1-Wert 
aufweist, ttbertragt den Inhalt des Schieberegisters 1436. Die Ausgange aller 
5 Nullgeneratoren werden miteinander verodert (143 9) , sodass die Selekt-Signale 
SC0..n (1433) entstehen. 

Durch diese Funktion zeigt nunmehr ein eingehender Trigger viber die 
Null funk tionen auf ein Schieberegister 1436, dessen gesetztes Bit wiederum 
10 auf ein Glied in der Ketten (1414, 1421) zeigt. 

Bei einem Flush schieben die Schieberegister 143 6 gleich dem Schieberegister 
1435 den gespeicherten Wert urn genau so viele Posi tionen, wie Glieder in den 
Ketten geiascht wurden, in Richtung des niederwertigen Bits. 1st nach dieser 
15 Operation der Inhalt eines Schieberegisters gleich Null, da das PBIT uber das 
niederwertigste Bit hinausgeschoben wurde, bedeutet dies, dass die vormals 
referenzierte Konf iguration gelSscht wurde. 

Liefert 1434 far einen eingetrof f enen Trigger 1431 den Wert Null am Ausgang 
20 1433, ist eine Konf igurationsauf f orderung an die Konf igurat ions einhe it zu 
senden, um die fehlende Konf iguration zu laden oder ggf . auch ein 
Fehlerstatus an die Konf igurationseinheit zu melden. 

Die tJbersetzung der eingehenden Trigger 1431 nach 1437 in 1432 kann nach 
25 mehreren Prinzipien erfolgend, die einzeln oder gemeinsam angewendet werden 
kOnnen, beispielsweise: 

1 . Dekoder entsprechend der Funktion eines 74LS148 

2. Round-Robin Arbiter (vgl. PACT10) 

3. Iiookup-Tabelle (vgl. PACT10) 

30 Prinzipiell kann die ubersetzung dem in PACT10 beschriebenen Verfahren 
entsprechen (Round -Robin- Arbiter, LUT1) . 

Fehlt eine ttbersetzungsvorschrif t, beispielsweise bei der Anwendung von 
Lookup -Tabell en, ist eine Konf igurationsauf f orderung an die 

Konf igurationseinheit zu senden, um die fehlende Konf iguration zu laden oder 
35 ggf. auch ein Fehlerstatus an die Konf igurationseinheit zu melden. 

Eine weitere wesentliche Funktion des Konf igurations stacks nach Figur 14 ist 
das Sequenzen tlber Konf igurationen, was bedingte und unbedingte Sprtlnge 
innerhalb des Speichers 1401 bedeutet. Daher ist auch diese Funktion 
40 detailliert in Figur 14b beschrieben. 

Ein Befehlsdekoder (1462) erkennt bedingte und unbedingte Sprungbef ehle in 
Konf igurationsworten (1402) beim Lesen aus dem Speicher 1401. Einem 
Sprungbefehl ist als Konstante die relative Sprungadresse zur aktuellen 
45 Position zugeordnet, die vom Befehlsdekoder dekodiert und ausgegeben wird 
(1463). Je nach Sprungrichtung ist der Wert positiv oder negativ. 
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Weiterhin ist als Konstante ein Vergleichswert (1469) mit den eintref fenden 
Triggern oder den Statusflags der PAE, beispielsweise die ALU-Flags zero, 
carry, negative, overflow, etc. oder die Speicher- Flags full, empty, etc., 
angegeben, in Abhangigkeit dessen bedingte Sprttnge durchgeftihrt werden. Diese 
5 wird an eine Vergleichseihheit 1464 tibermittelt, die den Wert mit den Flags 
(1465) und/oder Triggern, die von dem Augang ttbersetzungs- und 
Zuweisungseinrichtung (1437) und/oder direkt von dem Bussystem 0105 stammen, 
verglichen. 

10 Eine Steuereinheit (1466) generiert in Abhangigkeit des Befehles (bedingter 
oder unbedingter Sprung = "Type") und des Vergleichsergebnisses die 
Ansteuerung fur den Lesezeiger (1405) wie folgt: 

Unbedingter Sprung: Generiere "Set", urn neue Adresse nach 1405 zu laden; 
Bedingter Sprung, Vergleich erfiillt: Generiere "Set", um neue Adresse nach 
15 1405 zu laden; 

Bedingter Sprung, Vergleich nicht erfullt: Generiere "Count", um Adresse des 
nachfolgenden Befehles in 1405 zu berechnen. 

Das Setzen einer neuen Adresse geschieht durch Aufaddieren. (1468) der 
20 relativen Sprungadresse (1463) zum aktuellen Wert von 1405. ttber einen 

Multiplexer (1467), der zwischen der aufaddierten neuen Adresse und der von 
1415 generierten Startadresse von Konf igurationen (1461) auswahlt, wird die 
neue Adress bei Anliegen von "Set" in den Lesepointer 1405 geschrieben. 

25 Die Arbeitsweise des Konf igurat ions tacks macht die Verwendung von 

Konfigurationseinheiten (CT) wie aus PACT10 und PACT17 bekannt weitgehend 
oboslet, vielmehr ist eine verteilte, parallele CT durch die 
Konf igurat ions stacks entstanden. 

Zwei Aufgaben der CT konnen dabei jedoch bei einer solchen Einheit 
30 verbleiben: 



1. Das Laden der Konf igurationen aus einem Speicher, der chipintern oder 
-extern implementiert sein kann, als flUchtiger oder nicht flUchtiger 
(ROM, EPROM, EEPROM, Flash-ROM, etc) Speicher ausgestaltet sein kann 

35 und/oder ein Massenspeicher sein kann. Dies kann nunmehr durch einen 

einfachen Mikrokontr oiler erfolgen, der Daten an die PAEs sendet und 
auf die zuruckgemeldete Quittierung reagiert. Beispielsweise kann 
bevorzugt die Einheit aus PACT 05 als Mikrokont roller bzw. der in 
PACT 05 beschriebene Algorithmus eingesetzt werden. Das Laden muS nicht 

40 mehr zwingend aktiv geschehen, sondern es ist ausreichend, wenn eine 

Einheit vorhanden ist, die auf das Konf igurationsanf orderungskommando 
das Hereinholen der neuen Konf igurationsdaten in die jeweilige PAE 
bzw. deren zugeordneten Konf igurat ionsspeicher veranlasst. Dies kann, 



II. f«pt«n**r 1003 



57 



Akte: PACT31PCToe M . 



etwa bei den vorstehend diskutierten I/O-PAEs auch jene PAE selbst 
sein, die derzeit neue Konf igurations da ten benStigt. 

2. Die verbleibende Resteinheit kann verwendet werden, urn 

sicherzustellen, dass Rekonf igurations trigger (WCT) in einer 
bestimmten Reihenfolge sortiert durch das Array laufen und/oder 
vorgeladene Konf igurationen in der erf order lichen Reihenfolge 
abgearbeitet werden und/oder noch nicht geladene, aber bendtigte 
Konf igurationen wie erforderlich angefordert und /oder geladen werden. 
Diese Rekonfigurationstriggerpriorisierung kann dazu verwendet werden, 
zu Priorisieren, auf welchen Rekonf igurationsanf orderungs trigger 
zuerst reagiert werden soil. Dies stellt die konf liktfreie Abarbeitung 
unterschiedlicher, moglicher Konf igurationen sicher, indem lediglich 
festgelegt wird, welcher Trigger zunachst durch das Array lauft. Wenn 
ein solcher Trigger eine bestimmte PAE betrifft, die auf diesen 
Trigger reagieren soli, wird sie sich dies merken, urn dann als 
nachstes auf diesen Trigger reagieren zu konnen, sobald sie 
rekonf iguierbar ist. Es sei erwahnt, dass bevorzugt die einzelne Zelle 
Oder ein Zellgebilde oder dergl. nicht nur jene Trigger vormerkt, die 
unmittelbar nachfolgend abzuarbeitende Konf igurationen betreffen, 
sondern dass auch alle we iter en oder wenigstens mehrere, von dieser 
Zelle kiinftig abzuarbeitenden Konf igurationen in ihrer Reihenfolge 
abgelegt werden kdnnen und/oder sollen, so dass jede Zelle oder 
Zellgruppe die Information aus den Triggervektoren erhalt und behalt, 
die sie zukUnftig und/oder aktuell betrifft. Damit wird die Filmo- 
Funktion der frttheren CT ttberflussig und durch den Zeitverlauf der 
Triggervektoren im wesentlichen ersetzt. 

3. Sofern nur ein Rekonf igurations trigger verwendet wird, sind keine 
besonderen Mafinahmen erforderlich. Wenn mehrere 

Rekonf igurations trigger (WCT) auftreten k6nnen, mtissen diese ohne 
zeitliche Oberlagerung, also nacheinander in fester Reihenfolge und 
kreuzungsfrei durch das Array laufen, urn Deadlocks zu verhindern. 

Die kann durch das in Figur 16 dargestellte Verfahren sicherge stellt werden, 
bei welchen durch Routing-MaSnahmen fur eine korrekte zeitliche Weiterleitung 
von WCT zu sorgen. Von einer zentralen Instanz (1603) werden mehrere WCT fur 
verschiedene PAEs (1601) generiert, die jedoch zeitlich aufeinander 
abgestimmt sein sollen. Die unterschiedlichen Entfernungen der 1601 in der 
Matrix fuhren zu unterschiedlichen Laufzeiten, bzw. Latenzzeiten. Dies wird 
in dem vorliegenden Beispiel durch das geeignete Einsetzen von Pipelines tuf en 
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(1602) durch den, dem Compiler zugeordneten Router, erreicht (vgl . PACT13) . 
Die sich dadurch ergebenden Latenzen sind mit dl-d5. angegeben. Es 1st 
ersichtlich, daS in Richtung des WCT-Flusses (1604) in jeder Stufe (Spalte) 
dieselben Latenzen auftreten. Beispielsweise ware 1605 nicht notwendig, da 
die Entfemung von 1606 von 1603 sehr gering ist. Da aber fur 1607 und 1608 
je ein 1602 auf grand der durch die langere Distanz entstehenden Laufzeit 
eingefttgt werden muS, wird 1605 zum Abgleich der Laufzeit notwandig. 
Die zentrale Instanz 1603 nimmt von den PAEs eingehende 

Rekonfigurationstrigger (1609) auf und priorisiert diese, um sie dann jeweils 
emzeln und nacheinander als WCT an das Array aus PAEs zu senden. Mit 
anderen Worten sendet eine PAE, die einen Rekonfigurationstrigger generiert, 
dxesen nicht direkt an andere PAEs weiter, sondern ausschlieSlich an die 
zentrale Instanz 1603. 

Die zentrale Instanz speichert eingehende Trigger und priorisiert diese. Dazu 
kann bevorzugt das aus PACT10 bekannt Verfahren des SCRR-ARB verwendet 
werden, wie es in Figur 8 PACT10 ausftihrlich beschrieben ist. 
Samtliche erwahnten PACT-Schutzrechte sind zu Of f enbarungszwecken 
vollumfanglich eingegliedert. 
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Titel: 
5 Pa tent ansprtiche 

1. Zellementefeld zur Datenverarbeitung mit Funk t ions ze 11 en zur Ausfuhrung 
algebraischer und/oder iogischer Funktionen una Speicherzellen, um 
Information zu empfangen, abzuspeichern und/oder auszugeben, dadurch 

10 gekennzeichnet, daS von den Funktionszellen eine Steuerverbindung zu den 

Speicherzellen geftthrt ist. 

2. Zellementefeld nach dem vorhergehenden Anspruch, dadurch gekennzeichnet, 
daS ein Prozessor, Coprozessor und/oder Microcontroller mit einer 

15 Vielzahl in Funktion und/oder Vernetzung rekonf igurierbarer und/oder 

vorgebbarer Einheiten wie Funktionszellen und/oder Speicherzellen bildet. 

3. Zellementefeld nach einem der vorhergehenden Ansprtiche, dadurch 
gekennzeichnet, daS die Funktionszellen als arithmetische Logikeinheiten 

20 gebildet sind. 

4. Zellementefeld nach dem vorhergehenden Anspruch, dadurch gekennzeichnet, 
dafi die arithmetischen Logikeinheiten als erweiterte ALUs gebildet sind. 

25 5 . Zellementefeld nach einem der vorhergehenden Ansprtiche, dadurch 

gekennzeichnet, daS die Speicherzellen zur fluchtigen und/oder nicht 
flilchtigen Datenspeicherung ausgebildet sind. 

6. Zellementefeld nach einem der vorhergehenden Ansprtiche, dadurch 
30 gekennzeichnet, dafi die Speicherzellen zur Abspeicherung von zu 

verarbeitenden Daten und/oder von zu verarbeitenden Programmschritten 
ausgebildet sind. 

7. Zellementefeld zur Datenverarbeitung, dadurch gekennzeichnet, dafc die 
35 Speicherzellen dazu ausgebildet sind, abgespeicherte Inf ormationen auf 

Ansteuerung der sie steuernden Funktionszelle direkt und/oder indirekt 
auf einen zur Funktionszelle fUhrenden Bus zu geben. 

8. Zellementefeld nach einem der vorhergehenden Ansprtiche, worin zumindest 
40 einer Speicherzelle und/oder Funktionszelle Register zugeordnet sind, 

insbesondere ein Backward-Register, welches im Inf ormat ions weg zwischen 
Speicherzelle und Funktionszelle angeordnet ist. 

9. Zellementefeld nach einem der vorhergehenden Ansprtiche, dadurch 

45 gekennzeichnet, daS die Speicherzelle dazu angeordnet ist, Inf ormationen 

von der sie steuernden Funktionszelle, einer Eingabe-Ausgabe-Zelle 
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und/oder einer sie nicht steuernden Zelle mit arithmetischer Logikeinheit 
zu empfangen. 

10. Zellementefeld nach einem der vorhergehenden Ansprtiche, dadurch 
gekennzeichnet, daS der Funktionszellen-Speicherzellen-Kombination 
zumindest ein Ein-Ausgabe-Mittel zugeordnet ist, urn Inf ormationen an eine 
externe Einheit und/oder eine andere Funktions zelle, Funkt ions z ell en- 
Speicherzellen-Kcmbination und/oder Speicherzelle zu send en und/oder von 
dieser zu empfangen. 

11. Zellementefeld nach dem vorhergehenden Anspruch, dadurch gekennzeichnet, 
daS das Ein-Ausgabe-Mittel gleichfalls zum Empfang von Steuerbef ehlen 
aus der Funktionszelle ausgebildet ist. 

15 12. Zellementefeld nach einem der vorhergehenden Ansprtiche, dadurch 

gekennzeichnet, da& die Steuerung dazu ausgebildet ist, zumindest 
einige, bevorzugt alle der nachf olgenden Befehle zu ttbertragen und/oder 
die Speicherzelle bzw. Eingabe/Ausgabe-Zelle dazu ausgebildet ist, die 
f olgenden Befehle zu dekodieren: DATA WRITE/READ, ADRESSPOINTER 

20 WRITE/READ, PRO GRAMMPO INTER WRITE/READ, PROGRAMMPO INTER INCREMENT, 

STACKPO INTER WRITE/READ, vorgenannte Befehle jeweils insbesondere fUr 
internen und/oder externen Zugriff , PUSH, POP, OPCODE, FETCH. 

13. Zellementefeld nach einem der vorhergehenden Ansprtiche, dadurch 

25 gekennzeichnet, daE die Funktionszelle als alleiniger Master auf die 

Steuerverbindung und/oder das als Steuerungsverbindung dienende 
Bussegment zugreifen kann. 

14. Zellementefeld zur Datenverarbeitung nach einem der vorhergehenden 
30 Ansprtiche, dadurch gekennzeichnet, dafi die Funktionszelle zumindest 

einer von Speicherzelle und Ein-Ausgabezelle benachbart angeordnet ist. 

15. Zellementefeld nach einem der vorhergehenden Ansprtiche, dadurch 
gekennzeichnet, daS die Zellelemente multidimensional angeordnet sind, 

35 insbesondere matrixartig, wobei die Funktionszelle und/oder die 

benachbarte Speicher- bzw. Ein-Ausgabezelle aus einer oberen Reihe Daten 
empfangen und in eine untere Reihe Daten ausgeben kann, wobei in einer 
Reihe Busse vorgesehen sind und die Funktionszelle und zumindest eine 
Speicher- und/oder Ein-Ausgabezelle in ein und derselben Reihe liegen. 

40 

16. Verfahren zum Betrieb eines Zellelementef eldes, insbesondere 
multidimensional en Zellelementef eldes mit Funktionszellen zur Ausfuhrung 
algebraischer und/oder logischer Funkt ionen und 

Informationsbereitstellungszellen, insbesondere Speicherzellen und/oder 
45 Ein-Ausgabezellen zum Empfangen und/oder Ausgeben von Inf ormationen 

und/oder Speichern derselben, dadurch gekennzeichnet, daS zumindest eine 
der Funktionszellen Steuerbef ehle an zumindest eine 
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Informationsbereitstellimgszelle ausgibt, dort im Ansprechen auf die 
Steuerbefehlinformation fur die Funktionszelle verarbeitet wird und die 
Funktionszelle dazu ausgebildet ist. eine weitere Datenverarbeitung im 
Ansprechen auf aus der Inf ormationsbereitstellungszelie bereifcgestellte 
5 information dur chzuf uhren , urn so sequenzerartig Daten zu verarbeiten. 

17. Verfahren nach einem der vorhergehenden Anspruche, dadurch 

gekennzeichnet, daS die Funktionszelle dazu ausgebildet ist, zumindest 
einige der Steuerbef ehle 
10 OPCODE FETCH , 

DATA WRITE INTERN, 
DATA WRITE EXTERN, 
DATA READ INTERN, 
DATA READ EXTERN, 
15 ADRESS POINTER WRITE INTERN, 

ADRESS POINTER WRITE EXTERN, 
ADRESSPO INTER READ INTERN, 
ADRESS POINTER READ EXTERN, 
PROGRAMMPO INTER WRITE INTERN, 
20 PROGRAMMPO INTER WRITE EXTERN, 

PROGRAMMPO INTER READ INTERN, 
PROGRAMMPO INTER READ EXTERN, 
STACKPOINTER WRITE INTERN, 
STACKPOINTER WRITE EXTERN, 
25 STACKPOINTER READ INTERN, 

STACKPOINTER READ EXTERN, 
PUSH, 
POP, 

PROGRAMMPOINTER INCREMENT 
30 ausgibt und im Laufe Zellementbetriebs zumindest einige, insbesondere 

alle der oben genannten Steuerbef ehle wie erforderlich ausgibt. 



18. Datenverarbeitungsanordnung mit einem multidimensional en 
35 Feld 

in Funktion und/oder Vernetzung konf igurierbarer Zellelemente und 
diesen zugeordneten Konf igurationsvorhaltemitteln zum lokalen 
Konf igur ations -Vorhal t en , 
dadurch gekennzeichnet, dafi 
40 die Konf igurationsvorhaltemittel dazu ausgebildet sind, 

zumindest einen Teil der vorgehaltenen Konf igurationen 
nichtf lttchtig vorzuhalten. 

19. Datenverarbeitungsanordnung mit einem multidimensional en 
45 Feld 

in Funktion und/oder Vernetzung konf igurierbarer Zellelemente und 
diesen zugeordneten Konf igurationsvorhaltemitteln zum lokalen 
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Konf igurations -Vorhal ten , 

dadurch gekennzeichnet , d a £ 
die Konf igurationsvorhaltemittel dazu ausgebildet sind, 
alle vorgehaltenen Konf igurationen 
5 nichtfltichtig vorzuhalten. 

20. Datenverarbeitungsanordnung nach einem der vorhergehenden 
Datenverarbeitungsanordnungsanspruche, dadurch gekennzeichnet, dais die 
Funktion grobgranular konf igurierbar ist. 

10 

21 . Datenverarbeitungsanordnung nach einem der vorhergehenden 
Datenverarbeitungsanordnungsansprtlche, dadurch gekennzeichnet, daS die 
Vernetzung grobgranular konf igurierbar ist. 

15 22 . Datenverarbeitungsanordnung nach einem der vorhergehenden 

Datenverarbeitungsanordnungsansprtiche, dadurch gekennzeichnet, dais als 
Zellelemente zumindest eines von ALUs, EAlUs, RAM-Zellen, I/O-Zellen, 
Logibl6cken vorgesehen sind. 

20 23 . Datenverarbeitungsanordnung nach einem der vorhergehenden 

Datenverarbeitungsanordnungsansprttche, dadurch gekennzeichnet, daS jedem 
Zellelement ein eigenes Konf igurationsvorhaltemittel zugeordnet ist. 

24. Datenverarbeitungsanordnung nach einem der vorhergehenden 

25 Datenverarbeitungsanordnungsansprtiche, dadurch gekennzeichnet, daS die 

Konf igurationsvorhaltemittel dazu ausgebildet sind, eine Vielzahl von 
Konf igurationen vorzuhalten. 

25 . Datenverarbeitungsanordnung nach einem der vorhergehenden 

30 Datenverarbeitungsanordnungsanspruche, dadurch gekennzeichnet, daS 

mehrere fest vorgegebene nichtf liichtige Konf igurationen im 
Konf igurationsvorhaltemittel vorgegeben sind. 

26. Datenverarbeitungsanordnung nach einem der vorhergehenden 

35 Datenverarbeitungsanordnungsansprtlche, dadurch gekennzeichnet, daS die 

Anordnung dazu ausgebildet ist, eine wechselnde einer Vielzahl von 
vorgehaltenen Konf igurationen zu verwenden, insbesondere im Wege der 
Wave-Rekonf iguration oder des lokalen Sequencing. 

40 27. Datenverarbeitungsanordnung nach einem der vorhergehenden 

Datenverarbeitungsanordnungsansprttche, dadurch gekennzeichnet, da& bei 
einigen Zellen im Betrieb mit verander lichen Konf igurationen versehbare 
Konf igurationsvorhaltemittel vorgesehen sind. 

45 28. Datenverarbeitungsanordnung nach einem der vorhergehenden 

Datenverarbeitungsanordnungsansprttche, dadurch gekennzeichnet, daS als 
Konf igurationsvorhaltemittel" zunmindest eines aus ROM, EPROM, EEPROM, 
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Flash-Speicher, Fuse-, Antifuse-programmierbare Speichermittel und/oder 
in insbesondere in oberen Lagen einer Siliziumstruktur fest vorgesehene 
Speichermittel gewahlt sind. 

5 29. Verfahren zur Herstellung einer dedizierten 

Datenverarbeitungsanordnung, dadurch gekennzeichnet, daS ein ■ 
multidimensionales Feld mit in Funktion und/oder Vernetzung 
konfigurierbaren Z el lei em ante und dies en zugeordneten 
Konf igurationsvorhaltemitteln zura lokalen Konf igurations-Vorhal ten 
10 vorgegeben wird, bestimmt wird, welche Konf igurationen in diesen 

vorzuhalten sind, und dann nichtf luchtige Konf igurationsvorhaltemittel 
so vorgesehen werden, daS sie zumindest einen Teil der vorgehaltenen 
Konf igurationen nichtf lilchtig vorhalten. 

15 30. Verfahren nach dem vorhergehenden Datenverarbeitungsanordnungsanspruch, 
dadurch gekennzeichnet, daS von einem zur lauf zeitrekonf igurierbaren 
multidimensional en Feld ausgegangen wird. 

31. Verfahren nach dem vorhergehenden Datenverarbeitungsanordnungsanspruch, 
20 dadurch gekennzeichnet, daS zunachst von einem zur 

lauf zeitrekonf igurierbaren multidimensional en Feld mit 
Rekonf igurationsbeschaltung ausgegangen wird und dann fur 
Rekonf iguration nichtben5tigte Felder weggelassen werden. 

32. Datenverarbeitungsanordnung, insbesondere nach einem der vorhergehenden 
25 Anspruche, insbesondere Prozessor, mit einem Feld aus. zur Laufzeit in 

Funktion und/oder Vernetzung datenverabeitenden rekonf igurierbaren 
Zellen, denen Speicher und eine Sequenzer s teuerung zugeordnet ist, 
dadurch gekennzeichnet, daS die Steuerung derart ausgebildet ist, dafi 
sich ein vollstandiger und/oder liraitierter Befehssatz ergibt. 

30 

33. Datenverarbeitungsanordnung, insbesondere nach einem der 
vorhergehenden Anspruche, insbesondere Prozessor, mit einem Feld aus 
zur Laufzeit in Funktion und/oder Vernetzung datenverabeitenden 

35 rekonf igurierbaren Zellen, mit einer ALU oder anderen logischen 

Verknupfungsbeschaltung und dieser zugeordnetem, insbesondere 
integriertem Speicher, dadurch gekennzeichnet, da£ der Speicher in 
einer anderen Halbleiter-Lage, insbesondere oberhalb der ALU oder 
anderen logischen Verknupfungsbeschaltung angeordnet ist. 

40 

34. Datenverarbeitungsanordnung, insbesondere nach einem der 
vorhergehenden Anspruche, insbesondere Prozessor, mit einem Feld aus 
zur Laufzeit in Funktion und/oder Vernetzung datenverabeitenden 
rekonfigurierbaren Zellen, von denen einige Speicherzwecken dienen, 

45 dadurch gekennzeichnet, dafi diese Zellen dazu ausgebildet sind, eine 

MMU und/oder DMA - Funktion zu realisieren. 
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35. Datenverarbeitungsanordnung, insbesondere nach einem der 

vorhergehenden Ansprttche, insbesondere Prozessor, mit einem Feld aus 
zur Laufzeit in Funktion und/oder Vernetzung datenverabeitenden 

5 rekonfigurierbaren Zellen, dadurch gekennzeichnet, daS wenigstens 

eine, bevorzugt zumindest einige, insbesondere bevorzugt nicht alle, 
Zellen eine Eingangs/Ausgangs funktion realisieren und bevorzugt 
zugleich eine ALU oder anderen logischen verknttpfungsbeschaltung zur 
Datenverarbeitung und/oder -veranderung aufweisen, wobei insbesondere 

10 Mittel vorgesehen sind, urn jedem EinganGs- und/oder Ausgangskanal eine 

definierte Adresse zuzuordnen, und/oder wobei 
Senderidentifkationsmittel vorgesehen sind. 

36. Datenverarbeitungsanordnung, insbesondere nach einem der 

15 vorhergehenden Ansprttche, insbesondere Prozessor, mit einem Feld aus 

zur Laufzeit in Funktion und/oder Vernetzung datenverabeitenden 
rekonfigurierbaren Zellen, dadurch gekennzeichnet, daS zumindest 
einige, bevorzugt nicht alle, Zellen f eingranulare FPGA-Strukturen 
aufweisen, wahrend andere Zellen grobgranulare Strukturen aufweisen. 

20 . 

37. Datenverarbeitungsanordnung nach dem vorhergehenden Anspruch, wobei 
eine Konf igurationseinheit zur schnellen Rekonf iguration der Zellen 
vorgesehen ist, dadurch gekennzeichnet, dafc die Konf igurationseinheit 
nur zur Konf iguration der grobgranularen und/oder der Nicht-FFGA- 

25 Zellen beschaltet ist. 

38. Datenverarbeitungsanordnung, insbesondere nach einem der 
vorhergehenden Ansprttche, insbesondere Prozessor, mit einem Feld aus 
zur Laufzeit in Funktion und/oder Vernetzung datenverabeitenden 

30 rekonfigurierbaren Zellen zur Verarbeitung von Daten mit einer hoheren 

Bitbreite, dadurch gekennzeichnet, daS die Zellen dazu ausgebildet 
sind, wahlweise Daten mit einer hc-heren Bitbreite oder Daten mit 
geringerer Bitbreite zu verarbeiten, wobei dann mehrere Daten mit 
geringerer Bitbreite simultan verarbeitbar sind, insbesondere nach Art 

35 eines SIMD-Rechenwerkes . 

39. Datenverarbeitungsanordnung, insbesondere nach einem der 
vorhergehenden Ansprttche, nach dem vorhergehenden Anspruch, dadurch 
gekennzeichnet, dafi zur Zelle hin oder von dieser weg ftthrende Busse 

40 teilbar sind, insbesondere urn mehrere Datenstrc-me mit geringerer 

Bitbreite als der in der Zelle maximal bearbeitbaren Bitbreite 
unabhangig weiterleiten und/oder empfangen zu k6nnen. 

40. Datenverarbeitungsanordnung, insbesondere nach einem der 

45 vorhergehenden Ansprttche, nach dem vorhergehenden Anspruch, dadurch 

gekennzeichnet, daS die Busverwaltung lokal in der Zelle erfolgt. 
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41. Datenverarbeitungsanordnung insbesondere nach einem der vorhergehenden 
Ansprtiche, dadurch gekennzeichnet, dafi einer PAE ein Speicher zur 
Sequenzerrealisierung zugeordnet ist und die Adressbusse als 
Teiladresbusse aufteilbar sind. 



42. 



10 



Datenverarbeitungsanordnung insbesondere nach einem der vorhergehenden 
Ansprtiche, dadurch gekennzeichnet, daE einer PAE ein Speicher zux 
Seguenzerrealisierung zugeordnet ist und eine Anordnung vorgesehen 
ist, urn bei Zugriff auf eine Speicherstelle sowohl Informationen 
betreffend die Adresse einer Speicherstelle fur den nachsten 
Speicherzugriff zu bestimmen als auch Daten und/oder Befehle zu 
ermitteln. 



15 
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